Bitget App
Cмартторгівля для кожного
Купити криптуРинкиТоргуватиФ'ючерсиКопітрейдингBotsEarn
Співробітники OpenAI публічно звинувачують результати тестів продуктивності останньої AI-моделі xAI, Grok3, у введенні в оману

Співробітники OpenAI публічно звинувачують результати тестів продуктивності останньої AI-моделі xAI, Grok3, у введенні в оману

Переглянути оригінал
Bitget2025/02/23 03:37

Нещодавно співробітник OpenAI публічно звинуватив компанію xAI Ілона Маска у випуску оманливих результатів тестів для останньої моделі штучного інтелекту Grok3. У відповідь Ігор Бабушкін, співзасновник xAI, наполягав на тому, що жодних порушень не було.

Графік xAI показує, що дві версії Grok3 - Grok3 Reasoning Beta та Grok3 mini Reasoning - перевершили найсильнішу доступну модель OpenAI o3-mini-high на AIME 2025. Однак співробітник OpenAI швидко вказав на платформі X, що графік xAI не включав оцінку o3-mini-high за умовою "cons@64" у AIME 2025.

На платформі X Бабушкін стверджував, що OpenAI також випускала подібні оманливі графіки тестів у минулому, незважаючи на те, що ці графіки використовувалися для порівняння продуктивності їхніх власних моделей.

0

Відмова від відповідальності: зміст цієї статті відображає виключно думку автора і не представляє платформу в будь-якій якості. Ця стаття не повинна бути орієнтиром під час прийняття інвестиційних рішень.

PoolX: Заробляйте за стейкінг
До понад 10% APR. Що більше монет у стейкінгу, то більший ваш заробіток.
Надіслати токени у стейкінг!