Golden Financeによると、OpenAIとAnthropicは最近、それぞれのテストで見逃されていた可能性のある問題を特定するため、相互のモデル評価を実施したとのことです。両社は水曜日にそれぞれのブログで、今夏、公開されている互いのAIモデルのセキュリティテストを実施し、幻覚傾向や、開発者の意図通りに動作しないいわゆる「ミスアライメント」について検証したと述べています。これらの評価は、OpenAIがGPT-5をリリースし、元OpenAI従業員によって設立されたAnthropicが8月初旬にOpus 4.1をリリースする前に完了していました。
全てのコメント