OpenAIの従業員は、xAIが最新のAIモデルGrok3のベンチマーク結果を誤解を招くものだと公に非難した。

最近、OpenAIの従業員が、イーロン・マスク氏のxAI社が最新のAIモデルGrok3のベンチマーク結果を誤解を招く形で公開したと公に非難した。これに対し、xAIの共同創設者イゴール・バブシュキン氏は、同社は何も不正行為を行っていないと主張した。 xAI のグラフは、Grok3 の 2 つのバージョン (Grok3 Reasoning Beta と Grok3 mini Reasoning) が、AIME 2025 で OpenAI の現在最も強力なモデルである o3-mini-high を上回ったことを示しています。しかし、OpenAI の従業員は、X プラットフォーム上で、xAI のチャートには「cons@64」での o3-mini-high の AIME 2025 スコアが含まれていないことをすぐに指摘しました。バブシュキン氏はプラットフォームXで、OpenAIが過去にも同様に誤解を招くベンチマークチャートを公開したことがあると主張した。ただし、これらのチャートは、独自のモデルのパフォーマンスを比較するために使用されます。

Recently Searched

Hot Coins

Trending

毎日の必読

おかえりなさい

アカウント登録

siteでログインする

siteで登録する

受信トレイを確認する

OpenAIの従業員は、xAIが最新のAIモデルGrok3のベンチマーク結果を誤解を招くものだと公に非難した。

全てのコメント

Recommended for you

米上院銀行委員会の委員長は、ステーブルコインの利回りに関する新たな草案が早ければ今週中にも公表される可能性があると述べた。

ゴールデンモーニングブリーフィング｜3月18日の主要な夜間動向

米国証券取引委員会（SEC）と商品先物取引委員会（CFTC）は、仮想通貨に関する新たな見解を発表し、ほとんどのデジタル資産は証券の範疇には含まれないとした。

詳細分析：Web 4.0金融パラダイム革命 – MMTエンジンによってDMDが機関投資家レベルのマーケットメイキング収益をどのように達成しているかを解明します。

マスターカードは、ステーブルコイン企業であるBVNKを最大18億ドルで買収する計画だ。

ビットコインは8日間連続で上昇し、76,000ドルに達した。混乱の中で金価格を上回るパフォーマンスを見せている背景には、どのような論理があるのだろうか？

トークンが売れない？それは、仮想通貨プロジェクトの90％が投資家向け広報を怠っているからだ。

Meta社は従業員の20％を解雇し続けている。これはAI時代の「効率化革命」なのか、それともコスト不安の表れなのか？

大統領にあなたの投稿を支持してもらうには、ミームコインがいくら必要？マイリー：500万。

DexFV × OpenClawの詳細分析：AI駆動型オンチェーン資本市場インフラ

毎日の必読

詳細分析：Web 4.0金融パラダイム革命 – MMTエンジンによってDMDが機関投資家レベルのマーケットメイキング収益をどのように達成しているかを解明します。

ビットコインが安定する一方で、なぜ金は「暴落」したのか？米イラン戦争下における新たな資産ロジック。

米国の税務調査は、6年前のウォレット交換にまで遡るのだろうか？新しいIRSフォームを4つの階層に分けて解説する。

891ページにも及ぶ訴訟書類と、1％未満という現実がぶつかり合う時、仮想通貨業界は偏見というジレンマに直面する。

OpenClaw: AIの「実行能力」を再定義する

なぜ暗号通貨はもう面白くなくなったのでしょうか?

人気のアクティビティ

RaveDAO at Terra Solis by Tomorrowland: A Female-Led Techno Night Where Web3 Culture Converges

人気のタグ

共有