「Meemi」という名前の Epoch AI 請負業者は、OpenAI が FrontierMath ベンチマークに財政的支援を提供しただけでなく、テスト問題バンクへの特権アクセスも取得したことを LessWrong フォーラムで明らかにしました。これが、o3 のパフォーマンスが短期間で大幅に向上した重要な理由である可能性があります。 スタンフォード大学の数学博士課程の学生、カリーナ・ホン氏は、Epoch AI の取り決めにより、OpenAI が FrontierMath に特権的にアクセスできるようになったと主張しています。請負業者の暴露により、進捗状況の通知表が覆されました。論争に直面して、Epoch AIの副ディレクター兼共同創設者であるTamay Besiroglu氏は、すぐにXプラットフォームの問題を認めた。 FrontierMath は、高度な数的推論能力の非常に重要な評価ベンチマークであることが報告されています。これは、Epoch AI と、複数のフィールズ賞受賞者や国際数学オリンピックの上級提案者を含む 60 名を超えるトップ数学者によって共同作成されました。
全てのコメント