AI AIに「自白」を促す新手法 Confessions――モデルの正直さはどこまで引き出せるのか
AIが時々“もっともらしく”間違える理由生成AIは、ときに誤りを自信満々に語ったり、都合のよい近道を取ってもそれを隠したりします。背景には、強化学習で「正確さ・分かりやすさ・安全性・好ましさ」など複数の目的を同時に最適化する設計があります。...
AI
AI
AI
AI
AI
AI
AI
AI
AI
AI