OpenAIの従業員がxAIの最新AIモデルGrok3のベンチマークテスト結果を誤解を招くものだと公に非難
最近、OpenAIの従業員が、Elon MuskのxAI社が最新のAIモデルGrok3のベンチマークテスト結果を誤解を招く形で公開したと公に非難しました。これに対し、xAIの共同創設者であるIgor Babushkinは、不正行為はなかったと主張しました。
xAIのチャートでは、Grok3の2つのバージョン - Grok3 Reasoning BetaとGrok3 mini Reasoning - が、AIME 2025においてOpenAIの現在最強のモデルであるo3-mini-highを上回ったと示されています。しかし、OpenAIの従業員はすぐにプラットフォームXで、xAIのチャートにはAIME 2025の「cons@64」条件下でのo3-mini-highのスコアが含まれていないと指摘しました。
プラットフォームXで、Babushkinは、OpenAIも過去に同様の誤解を招くベンチマークチャートを公開していたと主張しました。これらのチャートは、自社のモデル性能を比較するために使用されていました。
免責事項:本記事の内容はあくまでも筆者の意見を反映したものであり、いかなる立場においても当プラットフォームを代表するものではありません。また、本記事は投資判断の参考となることを目的としたものではありません。
こちらもいかがですか?
FARTCOINを5ヶ月間保有していたクジラが利益を確定し始め、7時間前に955,000 FARTCOINを売却
Ethos、匿名コメントの実験を開始、Kairosエージェントを介してオンチェーンに保存予定
昨日、BlackRockのIBITは6億4320万ドルの純流入があり、一方、ETHAは3030万ドルの純流出がありました。
クリプト提唱者スコット・メルカー:詐欺師が偽の暗号インフルエンサーの身元を使って少なくとも400万ドルを盗む
トレンド
もっと見る暗号資産価格
もっと見る








