1: すらいむ ★
AIに「分からないことを分からないと認める力」は身につくのか?OpenAIが有益な性質を強化学習で定着させる研究結果を公開
OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。
OpenAIは2026年6月18日、AIに正直さや不確実性を認める謙虚さ、訂正を受け入れる姿勢、公平性などの有益な性質を学習させると訓練に使っていない分野でも望ましい振る舞いが広がり、悪意ある指示にも崩されにくくなるという研究結果を公開しました。
2: 名無しのひみつ
これだよなぁ
Geminiはわからないことがあると平気で捏造する
捏造するなと指摘したらすぐ謝るけど、その直後に平然と繰り返すからあきれる
Geminiはわからないことがあると平気で捏造する
捏造するなと指摘したらすぐ謝るけど、その直後に平然と繰り返すからあきれる
3: 名無しのひみつ
copilotもそうだよ
ひとつのアカウントでそれはできませんって言ったことを
別のアカウントでできたことを指摘したら
永遠に言い訳してきた
ウソをつく機能がないのでウソはつかないだとよ
ひとつのアカウントでそれはできませんって言ったことを
別のアカウントでできたことを指摘したら
永遠に言い訳してきた
ウソをつく機能がないのでウソはつかないだとよ