← 用語辞書トップ

RLHF(人間フィードバックによる強化学習)

RLHF Reinforcement Learning from Human Feedback あーるえるえいちえふ / にんげんふぃーどばっく による きょうかがくしゅう
最頻出 ⚪ 旧用語 テクノロジ系 新しい技術

意味・解説

AI(主にLLM)の出力に対し、人間が「どちらの回答が優れているか」を評価(ランク付け)し、その結果をAIにフィードバックして性能を向上させる手法。

📖 詳しい解説・覚え方のコツ・試験対策・例文はアプリで

アプリで詳しく学ぶ
同義語: 人間参加型強化学習
分類: 生成AIの最適化技術
📱

アプリでもっと効率的に学習

2,651語の用語辞書・過去問28回分・232ステージ

7日間無料でお試し

Google Playで見る