Bitget App
Trading Inteligente
Comprar criptoMercadosTradingFuturosEarnWeb3CentroMás
Trading
Spot
Compra y vende cripto con facilidad
Margen
Aumenta tu capital y maximiza tus fondos
Onchain
Going Onchain, without going Onchain!
Convert
Convierte sin comisiones ni deslizamiento
Explorar
Launchhub
Obtén ventajas desde el principio y empieza a ganar
Copy
Copia al trader elite con un solo clic
Bots
Bot de trading con IA sencillo, rápido y confiable
Trading
Futuros USDT-M
Tradea futuros liquidados en USDT
Futuros USDC-M
Futuros liquidados en USDC
Futuros Coin-M
Tradea futuros liquidados en cripto
Explorar
Guía de Futuros
Un recorrido de principiante a experto en el trading de futuros
Promociones de futuros
Gana grandes recompensas
Resumen
Una variedad de productos para incrementar tus activos
Simple Earn
Deposita y retira en cualquier momento para obtener retornos flexibles sin riesgo.
On-chain Earn
Obtén ganancias diarias sin arriesgar tu capital
Earn estructurado
Innovación financiera sólida para sortear las oscilaciones del mercado
VIP y Gestión Patrimonial
Aumenta tu patrimonio con nuestro equipo de primer
Préstamos
Préstamos flexibles con alta seguridad de fondos
Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos

Empleados de OpenAI acusan públicamente que los resultados de las pruebas de referencia del último modelo de IA de xAI, Grok3, son engañosos

Ver el original
Bitget2025/02/23 03:37

Recientemente, un empleado de OpenAI acusó públicamente a la empresa xAI de Elon Musk de publicar resultados engañosos en pruebas de referencia para su último modelo de IA, Grok3. En respuesta, Igor Babushkin, cofundador de xAI, insistió en que no hubo ninguna irregularidad.

El gráfico de xAI muestra que dos versiones de Grok3 - Grok3 Reasoning Beta y Grok3 mini Reasoning - superaron al modelo actualmente más fuerte disponible de OpenAI, o3-mini-high, en AIME 2025. Sin embargo, un empleado de OpenAI señaló rápidamente en la plataforma X que el gráfico de xAI no incluía la puntuación de o3-mini-high bajo la condición "cons@64" en AIME 2025.

En la plataforma X, Babushkin argumentó que OpenAI también había publicado en el pasado gráficos de referencia engañosos similares. A pesar de que estos gráficos se utilizaban para comparar el rendimiento de sus propios modelos.

0

Descargo de responsabilidad: El contenido de este artículo refleja únicamente la opinión del autor y no representa en modo alguno a la plataforma. Este artículo no se pretende servir de referencia para tomar decisiones de inversión.

PoolX: Bloquea y gana nuevos tokens.
APR de hasta 12%. Gana más airdrop bloqueando más.
¡Bloquea ahora!