Reinforcement Learning from Human Feedback (Q115570683)
Jump to navigation
Jump to search
variant of reinforcement learning
- RLHF
- Reinforcement learning from human feedback
- reinforcement learning from human preferences
Language | Label | Description | Also known as |
---|---|---|---|
English | Reinforcement Learning from Human Feedback |
variant of reinforcement learning |
|
Statements
Sitelinks
Wikipedia(14 entries)
- arwiki التعلم المعزز من ردود الفعل البشرية
- bswiki Podržano učenje na osnovu povratnih informacija od ljudi
- cawiki Aprenentatge de reforç a partir de la retroalimentació humana
- dewiki Reinforcement learning from human feedback
- enwiki Reinforcement learning from human feedback
- fawiki یادگیری تقویتی از بازخورد انسانی
- frwiki Apprentissage par renforcement à partir de rétroaction humaine
- gawiki Foghlaim atreisithe ó aiseolas ón duine
- jawiki 人間のフィードバックによる強化学習
- kowiki 인간 피드백을 통한 강화 학습
- ptwiki Aprendizado por reforço com feedback humano
- ruwiki Обучение с подкреплением на основе отзывов людей
- srwiki Podržano učenje iz ljudskih povratnih informacija
- zhwiki 基于人类反馈的强化学习