阿里巴巴发布AI模型声称超越DeepSeek

美国之音

2025年1月29日 18:51

阿里巴巴透过旗下的阿里云，发表了自家的AI语言模型通义千问Qwen 2.5-Max超大规模MoE模型，甚至号称测试表现上优于DeepSeek V3。(美联社：2024年5月14日)

中国科技公司阿里巴巴星期三(1月29日)发布了其通义千问“Qwen 2.5”人工智能(AI)模型的新版本，并声称该模型已超越备受赞誉的DeepSeek-V3。

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家(MoE)模型的时间较不寻常，正值农历新年第一天，大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索(DeepSeek)过去三周的迅猛崛起，不仅给海外竞争对手、也给国内竞争者带来了压力。

“Qwen 2.5-Max…几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B，”阿里云在微信公众号上发布的一篇公告中说，其指的分别是OpenAI、深度求索和Meta最先进的开源AI模型。

据介绍，Qwen 2.5-Max使用超过20万亿token(AI模型处理的数据单位)的预训练数据及精心设计的后训练方案进行训练。

阿里云说，通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。在指令模型测试方面，Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型，并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

阿里云表示，在基座模型测试方面，通义团队将Qwen2.5-Max与目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B进行了对比，而Qwen2.5-Max在所有11项基准测试中全部超越了对比模型。

不过，微信公众号“简约财经”的帖子指出，Qwen 2.5-Max 在发展过程中仍面临着诸多挑战和风险，其中包括在技术挑战方面，训练优化过程中的计算资源消耗和时间成本问题，以及模型在复杂任务和多模态融合方面的性能提升需求，都需要进一步的研究和创新来解决。

这篇帖子说，在伦理与安全风险方面，Qwen 2.5-Max也面临数据隐私保护、模型偏见避免以及内容真实性和 AI 滥用防范等需要高度重视的问题。

DeepSeek与国内竞争对手

深度求索1月10日发布了其DeepSeek-V3模型驱动的AI助手，随后在1月20日推出R1模型。这一系列AI模型的新发布震撼了硅谷，并导致科技股重挫。深度求索据称低廉的开发和使用成本，促使投资者开始质疑美国领先AI公司的巨额支出计划。

深度求索的成功也引发了国内竞争对手竞相升级其本身的AI模型。

在DeepSeek-R1发布两天后，TikTok母公司字节跳动推出了其旗舰AI模型的更新，并声称该模型在AIME(旨在衡量AI模型对复杂指令的理解和回应能力的一项基准测试)中的表现优于微软支持的OpenAI的o1模型。

这与深度求索的说法相似。深度求索声称其R1模型在多个性能基准测试中可比得上OpenAI的o1。

DeepSeek-V3模型的前身DeepSeek-V2于去年5月发布后，引发了中国AI模型的价格战。

DeepSeek-V2采用开源和空前低廉的价格(每百万个tokens仅需1元人民币)，导致阿里云宣布对一系列模型的降价幅度最高达97%。

其他中国科技公司纷纷跟进，包括百度(2023年3月发布中国首个类同于ChatGPT的产品)以及中国市值最高的互联网公司腾讯。

深度求索的神秘创始人梁文锋在去年7月接受中国媒体《暗涌》(Waves)的罕见采访中表示，该公司“不在乎”价格战，其主要目标是实现AGI(通用人工智能)。

OpenAI将AGI定义为能够在大多数具有经济价值的任务上超越人类的自主系统。

相较于阿里巴巴等中国大型科技公司拥有数十万名员工，深度求索的运作方式像是一个研究实验室，其团队主要由来自中国顶尖高校的年轻毕业生和博士生组成。

梁文锋在去年7月的采访中表示，他认为中国大型科技公司可能不太适合未来的AI产业，并将这些企业的高成本和自上而下的架构，与深度求索采用的精简运营和宽松管理的风格，进行了对比。

“大型基础模型需要持续创新，科技巨头的能力是有限的，”他说。

（本文主要依据了路透社的报道。）

阿里巴巴发布AI模型声称超越DeepSeek

This item is part of

相关内容

DeepSeek 震撼硅谷和华尔街，但内容审查恐令其在国际市场遇挑战

DeepSeek横空出世，美中AI竞争会迎来根本性改变吗？

DeepSeek震撼减弱，全球市场企稳，纳指反弹强劲

特朗普警告：低成本中国AI为硅谷敲响警钟

美国AI公司试图破解DeepSeek破坏性创新技术

评论区

无障碍链接

关注我们

阿里巴巴发布AI模型 声称超越DeepSeek

This item is part of

相关内容

DeepSeek 震撼硅谷和华尔街，但内容审查恐令其在国际市场遇挑战

DeepSeek横空出世，美中AI竞争会迎来根本性改变吗？

DeepSeek震撼减弱，全球市场企稳，纳指反弹强劲

特朗普警告：低成本中国AI为硅谷敲响警钟

美国AI公司试图破解DeepSeek破坏性创新技术

评论区

阿里巴巴发布AI模型声称超越DeepSeek