← 用語辞書トップ

RLHF（人間フィードバックによる強化学習）

RLHF Reinforcement Learning from Human Feedback あーるえるえいちえふ / にんげんふぃーどばっくによるきょうかがくしゅう

最頻出 ⚪ 旧用語テクノロジ系新しい技術

意味・解説

AI（主にLLM）の出力に対し、人間が「どちらの回答が優れているか」を評価（ランク付け）し、その結果をAIにフィードバックして性能を向上させる手法。

📖 詳しい解説・覚え方のコツ・試験対策・例文はアプリで

アプリで詳しく学ぶ

同義語: 人間参加型強化学習

分類: 生成AIの最適化技術

📱

アプリでもっと効率的に学習

2,651語の用語辞書・過去問28回分・232ステージ

7日間無料でお試し

Google Playで見る