无障碍链接

中国时间 21:59 2025年1月30日 星期四

阿里巴巴发布AI模型 声称超越DeepSeek


阿里巴巴透过旗下的阿里云,发表了自家的AI语言模型通义千问Qwen 2.5-Max超大规模MoE模型,甚至号称测试表现上优于DeepSeek V3。(美联社:2024年5月14日)
阿里巴巴透过旗下的阿里云,发表了自家的AI语言模型通义千问Qwen 2.5-Max超大规模MoE模型,甚至号称测试表现上优于DeepSeek V3。(美联社:2024年5月14日)

中国科技公司阿里巴巴星期三(1月29日)发布了其通义千问“Qwen 2.5”人工智能(AI)模型的新版本,并声称该模型已超越备受赞誉的DeepSeek-V3。

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家(MoE)模型的时间较不寻常,正值农历新年第一天,大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索(DeepSeek)过去三周的迅猛崛起,不仅给海外竞争对手、也给国内竞争者带来了压力。

“Qwen 2.5-Max…几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,”阿里云在微信公众号上发布的一篇公告中说,其指的分别是OpenAI、深度求索和Meta最先进的开源AI模型。

据介绍,Qwen 2.5-Max使用超过20万亿token(AI模型处理的数据单位)的预训练数据及精心设计的后训练方案进行训练。

阿里云说,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。在指令模型测试方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

阿里云表示,在基座模型测试方面,通义团队将Qwen2.5-Max与目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B进行了对比,而Qwen2.5-Max在所有11项基准测试中全部超越了对比模型。

不过,微信公众号“简约财经”的帖子指出,Qwen 2.5-Max 在发展过程中仍面临着诸多挑战和风险,其中包括在技术挑战方面,训练优化过程中的计算资源消耗和时间成本问题,以及模型在复杂任务和多模态融合方面的性能提升需求,都需要进一步的研究和创新来解决。

这篇帖子说,在伦理与安全风险方面,Qwen 2.5-Max也面临数据隐私保护、模型偏见避免以及内容真实性和 AI 滥用防范等需要高度重视的问题。

DeepSeek与国内竞争对手

深度求索1月10日发布了其DeepSeek-V3模型驱动的AI助手,随后在1月20日推出R1模型。这一系列AI模型的新发布震撼了硅谷,并导致科技股重挫。深度求索据称低廉的开发和使用成本,促使投资者开始质疑美国领先AI公司的巨额支出计划。

深度求索的成功也引发了国内竞争对手竞相升级其本身的AI模型。

在DeepSeek-R1发布两天后,TikTok母公司字节跳动推出了其旗舰AI模型的更新,并声称该模型在AIME(旨在衡量AI模型对复杂指令的理解和回应能力的一项基准测试)中的表现优于微软支持的OpenAI的o1模型。

这与深度求索的说法相似。深度求索声称其R1模型在多个性能基准测试中可比得上OpenAI的o1。

DeepSeek-V3模型的前身DeepSeek-V2于去年5月发布后,引发了中国AI模型的价格战。

DeepSeek-V2采用开源和空前低廉的价格(每百万个tokens仅需1元人民币),导致阿里云宣布对一系列模型的降价幅度最高达97%。

其他中国科技公司纷纷跟进,包括百度(2023年3月发布中国首个类同于ChatGPT的产品)以及中国市值最高的互联网公司腾讯。

深度求索的神秘创始人梁文锋在去年7月接受中国媒体《暗涌》(Waves)的罕见采访中表示,该公司“不在乎”价格战,其主要目标是实现AGI(通用人工智能)。

OpenAI将AGI定义为能够在大多数具有经济价值的任务上超越人类的自主系统。

相较于阿里巴巴等中国大型科技公司拥有数十万名员工,深度求索的运作方式像是一个研究实验室,其团队主要由来自中国顶尖高校的年轻毕业生和博士生组成。

梁文锋在去年7月的采访中表示,他认为中国大型科技公司可能不太适合未来的AI产业,并将这些企业的高成本和自上而下的架构,与深度求索采用的精简运营和宽松管理的风格,进行了对比。

“大型基础模型需要持续创新,科技巨头的能力是有限的,”他说。

(本文主要依据了路透社的报道。)

评论区

美国之音中文节目预告

  • 7/23【时事大家谈】拜登退选中国网民热议 “把他赶下台”影射习近平?拜登退选牵动美外交政策 下届总统恐对中更强硬?嘉宾:美国“信息与战略研究所”经济学者李恒青; 美国《当代中国评论》国际季刊主编荣伟;主持人:樊冬宁

XS
SM
MD
LG