Bitget App
交易“智”变
行情交易合约跟单BOT理财Web3
阿里巴巴最新的人工智能模型QwQ-32B-Preview在一些基准测试中超越了OpenAI的o1

阿里巴巴最新的人工智能模型QwQ-32B-Preview在一些基准测试中超越了OpenAI的o1

CryptopolitanCryptopolitan2024/11/30 23:11
作者:By Enacy Mapakame

随着AI领域竞争的加剧,中国零售巨头阿里巴巴推出了QwQ-32B-Preview,据称其性能优于OpenAI的o1系列。

据报道,最新模型在某些特定基准测试中优于 OpenAI 的 o1-preview 和 o1-mini 模型,例如 AIME 和 MATH 测试,这些测试评估 AI 模型在逻辑难题和数学问题中的表现。

阿里巴巴已经制作了QwQ-32B-Preview供下载。

据这家零售巨头称,与 ChatGPT-4 和 Claude 3.5 等普通大语言模型 (LLM) 相比,阿里巴巴的新模型能够解决复杂的问题。

Benzinga 的一篇文章指出,QwQ-32B-Preview 是少数几个在宽松许可证下可用的产品之一,允许用户下载和使用它。该模型现已登陆AI开发平台Hugging Face。

然而,阿里巴巴发布了该模型的某些组件,以限制对该模型的完全复制或对其工作的深入了解。

阿里巴巴的最新模型拥有 325 亿个参数,可以处理多达 32,000 字的提示。凭借该模型的强大功能和半开放的可访问性,阿里巴巴的新进入者为人工智能推理技术的变革性飞跃奠定了基础。

阿里巴巴的透明声明强调了其模型的复杂性,而 OpenAI 却对其参数计数保密。

该模型的出现正值 OpenAI 在人工智能领域取得重大进展之际。 10 月份,OpenAI 在一轮成功的融资后估值跃升至 1570 亿美元。

另请参阅 意大利数据保护机构警告出版商不要与 OpenAI 共享数据

据报道,本周早些时候,软银集团 SFTBF 通过 15 亿美元的员工股份收购增加了其在 ChatGPT 制造商的股份。

据称,在美国司法部要求其剥离 Google Chrome 浏览器的压力下,OpenAI 还正在探索开发自己的网络浏览器,以挑战 Alphabet 的子公司 Google Chrome 浏览器。

阿里巴巴承认该模式也存在缺陷

尽管它具有一些独特的优势,但新模型也有局限性。据该组织称,QwQ-32B-Preview 存在意外语言切换等问题,这可能会让用户感到困惑。该模型在需要常识推理的任务中也表现不佳,这在许多人工智能系统中很常见。

根据 AutoGPT ,该模型可能会陷入逻辑循环,从而延迟响应。

尽管有缺点,但其推理能力使其能够进行事实检查,从而减少错误,但增加了解决时间。

通过任务推理和规划步骤,阿里巴巴的模型避免了一些影响传统人工智能系统的陷阱。但这种方法需要额外的时间,这可能会限制实时应用。

据Benzinga称,QwQ-32B-Preview的回应符合 中国监管标准 ,避免了政治敏感话题。

例如,像台湾这样的政治敏感话题会给出与中国政府立场一致的回应。

此外,有关天安门广场等事件的提示没有出现任何响应,显示了该模型的谨慎设计。

另请参阅 Inflection 表示不会参与构建下一代人工智能模型的竞争,但会收购初创公司

虽然这对于中国市场来说可能是理想的选择,但它也可能限制其在全球市场上的吸引力。然而,该模型是进入推理人工智能领域的重要一步。虽然其局限性可能会缩小其全球吸引力,但其逻辑和半开放性质等其他组件使其成为 OpenAI 的重要竞争对手。

据 AutoGPT 称,QwQ-32B-Preview 强调了这一令人兴奋的前沿领域的潜力和挑战,世界各地的人工智能实验室正在努力完善推理技术。

搜索...

0

免责声明:文章中的所有内容仅代表作者的观点,与本平台无关。用户不应以本文作为投资决策的参考。

PoolX:锁仓获得新代币空投
不要错过热门新币,且APR 高达 10%+
立即参与!

你也可能喜欢

10 亿美元空投后 HYPE 代币飙升 63%

Cryptopolitan2024/11/30 23:11

DOT每周上涨16%意味着如果…

波尔卡多特复检8.60美元!突破12.61美元或跌至4.15美元——DOT的下一步是什么?

币界网2024/11/30 21:21