OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

导航：首页>> 快讯>> OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

OpenAI 员工公开指责 xAI 最新 AI 模型 Grok3 的基准测试结果具有误导性

来源: chaincatcher 55天前

ChainCatcher 消息，据金十报道，OpenAI 的一名员工公开指责马斯克旗下的xAI公司，称其发布的最新 AI 模型 Grok3 的基准测试结果具有误导性。对此，xAI 的联合创始人伊戈尔・巴布什金（Igor Babushkin）则坚称公司并无不当。

xAI 的图表显示，Grok3 的两个版本——Grok3 Reasoning Beta 和 Grok3 mini Reasoning——在 AIME 2025 上的表现超过了 OpenAI 当前最强的可用模型 o3-mini-high。然而，OpenAI 的员工很快在 X 平台上指出，xAI的图表并未包含 o3-mini-high 在“cons@64”条件下的 AIME 2025 得分。

巴布什金在 X 平台上辩称，OpenAI 过去也曾发布过类似的误导性基准测试图表。尽管这些图表是用于比较其自身模型的表现。

利好

利空

最新资讯查看更多>

交易所
币种

排名	交易所	24h成交额
1	Binance	¥1,527.57 亿
2	Bybit	¥576.23 亿
3	Coinbase Exchange	¥71.57 亿
4	OKX	¥519.71 亿
5	Upbit	¥77.13 亿
6	Kraken	¥43.20 亿
7	Bitget	¥494.79 亿
8	Raydium	¥11.50 亿
9	Bitfinex	¥6.09 亿
10	Uniswap v2	¥3.72 亿
查看更多

排名	币种	24h成交额
1	Bitcoin	¥364.78 亿
2	Ethereum	¥184.99 亿
3	Tether USDt	¥788.03 亿
4	XRP	¥44.33 亿
5	BNB	¥22.55 亿
6	Solana	¥29.59 亿
7	Dogecoin	¥19.18 亿
8	USDC	¥57.95 亿
9	Cardano	¥5.70 亿
10	TRON	¥4.66 亿
查看更多