AIに「分からないことを分からないと認める力」は身につくのか？OpenAIが有益な性質を強化学習で定着させる研究結果を公開

2026/07/01 13:00

1: すらいむ ★ 2026/06/20(土) 22:11:33.80 ID:4fKrXnnZ

AIに「分からないことを分からないと認める力」は身につくのか？OpenAIが有益な性質を強化学習で定着させる研究結果を公開

　OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。

2: 名無しのひみつ 2026/06/20(土) 22:24:14.35 ID:k0GbjQ9/

これだよなぁ

Geminiはわからないことがあると平気で捏造する

捏造するなと指摘したらすぐ謝るけど、その直後に平然と繰り返すからあきれる

3: 名無しのひみつ 2026/06/20(土) 22:29:49.00 ID:PF+WEg4M

copilotもそうだよ

ひとつのアカウントでそれはできませんって言ったことを

別のアカウントでできたことを指摘したら

永遠に言い訳してきた

ウソをつく機能がないのでウソはつかないだとよ

続きはアプリで無料で読めます

アプリで続きを読む