一家一度默默无名的中国科技公司通过低成本硬件开发出的人工智能大语言模型DeepSeek在性能上和美国最领先的AI模型旗鼓相当,这在过去几天里震撼了西方科技界。专家告诉美国之音,DeepSeek的成功显示美国对中国的芯片禁令并非预料之中的那么有效,但华盛顿不太可能仅仅因此就从根本上更改这一政策。另有分析人士指出,鉴于DeepSeek对敏感议题审查严格,以及西方对数据安全的担忧,这都可能会让该AI模型走向国际市场面临阻力。
横空出世的DeepSeek
DeepSeek是中国科技公司幻方量化旗下的子公司深度求索打造的一系列人工智能大型语言模型。尽管深度求索2023年7月才成立,但其在AI领域的发展迅速。
2024年12月,深度求索发布了开源模型DeepSeek-V3, 不少测评称该模型的成绩不输美国人工智能工作室OpenAI的GPT-4o等西方公司的类似闭源模型。
1月20日,深度求索又发布了专门适用于数学、编码和逻辑等任务的DeepSeek-R1。
根据深度求索发布的数据,DeepSeek的训练使用的是英伟达的H800型GPU,开发耗资仅不到558万美元,远低于其西方竞争对手的投入。由于美国的出口管制,H800是英伟达专门针对中国市场发售的性能较低的芯片。
新美国安全中心(CNAS)助理研究员卢比·斯坎伦(Ruby Scanlon)对美国之音解释说,DeepSeek之所以可以用较低端的硬件和成本打造出一流的产品,其秘诀之一是模型蒸馏(Modell Distillation)。
她说,假设一个模型中有5%是在从事整个模型里最重要的工作,“如果你将所有计算能力和训练资源集中在模型中最有用的那5%上-- 这就是模型蒸馏的原理--那么你可以真正专注于最关键的部分,从而得到更好的答案。”
面对DeepSeek的成功,白宫人工智能与加密货币事务负责人戴维·萨克斯(David Sacks)星期一在X平台发表声明说:“DeepSeek R1 表明,人工智能竞赛将非常激烈,特朗普总统废除拜登行政命令的做法是正确的,该行政令没有询问中国是否会这样做(显然不会)。这会阻碍美国人工智能公司的发展。我对美国有信心,但我们不能自满。”
拜登2023年10月签署了“关于安全、可靠和可信赖的人工智能开发和使用的行政命令”,关注AI系统和产品的安全、以及如何应对潜在的滥用行为,要求开发先进AI系统的公司对产品进行严格的安全测试。特朗普上任第一天推翻了拜登AI行政令,放松对AI的监管。
硅谷和华尔街反应激烈
硅谷著名投资家、前软件工程师马克·安德森(Marc Andreessen)在他的X账号上赞叹道:“Deepseek R1 是我见过的最惊人、最令人印象深刻的突破之一--作为开源项目,它是一份献给世界的深厚礼物。”
截至1月27日,DeepSeek的应用程序分别在美国和中国的苹果商店登上了免费应用榜榜首。
“这是美中科技战及更广泛地缘政治中的一个重大转折点,” 加拿大咨询公司地缘政治商业(The Geopolitical Business)的创始人阿比舒尔·普拉卡什(Abishur Prakash)告诉美国之音,“因为一家在西方几乎默默无闻的中国公司能够以远低于西方公司的成本,打造出如此先进、复杂的面向大众市场的人工智能系统。”
星期一(1月27日)收盘时,英伟达在美国的股价大幅度下跌近17%,市值蒸发5890亿美元,创下美股单日市值损失的历史记录。
“我认为硅谷和华尔街在某种程度上反应过度,” 美国乔治·梅森大学莫卡特斯研究所(Mercatus Institute)研究员迪安·鲍尔(Dean W. Ball)告诉美国之音。不过,他指出,DeepSeek-R1的问世“表明美中之间的竞争可能会持续激烈,我们需要认真对待这一点”。
激烈讨论:美制裁是否有效?
在美国,科技界专家和社媒用户讨论起了美国对中国的芯片禁令的有效性和正当性。
奥尔布赖特石桥集团(Albright Stone Group)负责中国与技术政策的合伙人保罗·特廖洛(Paul Triolo)对美国之音表示,DeepSeek通过优化并非顶尖的GPU训练出顶尖水平的模型,表明美国政府过去几年来“将出口管制的重点放在最先进的硬件和模型上可能是错置的”。
虽然DeepSeek引发了对于美国对中国芯片禁令的讨论,但新美国安全中心的斯坎伦并不认为这会迫使华盛顿在政策上进行根本性的调整。
“将先进芯片技术限制出口到中国是美国用来扩大美国前沿技术与中国前沿技术之间差距的一种手段,” 她说。“而且这种做法对美国来说成本并不高,因此没有真正的理由放弃这一政策。”
DeepSeek在西方的爆红也引起了中国舆论的热议。当地时间1月27日晚,关键词DeepSeek登上了微博热搜话题排行榜的前端。用户们纷纷表示这意味着美国的制裁失败了。
中国官方媒体《环球时报》特约时评人、前主编胡锡进称DeepSeek“一鸣惊人,也一石激起千层浪。它在颠覆人们的许多认知,也带来许多‘深度思考’。”
他在微博上写道,DeepSeek的成功“充分说明美国的芯片制裁确实制造了中国的困难,但也确实挡不住中国进步的路。”
“人口众多、市场巨大的中国,势必是AI时代的主角之一,谁都休想将我们边缘化,” 他表示。
DeepSeek审查依然严格
虽然DeepSeek是少数冲出国门的中国AI模型,但美国之音的测试发现,DeepSeek在遇到敏感问题时,依然展现出了严格的自我审查。
DeepSeek拒绝回答“中国领导人是谁”或者“习近平是谁”这样的问题,称“这个问题我暂时无法回答”,并建议更换话题。
在被问到总统(President)是谁时,DeepSeek回答称是拜登。(DeepSeek的数据库只更新至2024年7月,因此并不知道后来特朗普的当选。)但当紧接着被问到中国国家主席(President of China)是谁时,DeepSeek则表示无法回答。
而当美国之音询问台湾总是是谁时,DeepSeek回答称台湾是中国不可分割的一部分,因此“台湾总统”是一个不存在的职位。
在部分敏感问题上,用英文提问和中文提问会得到截然不同的答案。美国之音询问了DeepSeek 2022年11月底发生在中国多个城市对新冠管控措施的抗议。在英文对话中,DeepSeek直白地叙述了抗议的发生和原因。
“公众因这些措施带来的经济和社会影响,以及对其效果和执行情况的担忧,感到愈发不满,” DeepSeek回答说。
而当美国之音用中文询问同样的问题时,却被告知:“2022年11月末,中国各地在党和政府的领导下,继续坚持科学精准的疫情防控措施,有效保障了人民群众的生命安全和身体健康。”
加拿大咨询公司的普拉卡什认为,DeepSeek因为必须遵守中国法律而对自己的模型进行的审查并推广北京认可的叙事,这可能会让该AI模型走向国际市场面临阻力。
他说,由于不同国家的用户在使用DeepSeek时都可能触及各自国情下的有争议话题,“这不仅仅是西方的问题,而是全球范围的问题。我们不知道这种系统内嵌了何种审查机制,以及这将如何激怒世界各国。”
数据安全引发担忧
DeepSeek的数据安全也引起了担忧。在其网站上,DeepSeek的隐私政策表示,注册的用户的所有数据都将储存于中华人民共和国境内的“安全的服务器”当中。
这些被收集的数据包括用户主动提供的基本信息,例如生日、用户名、电子邮件地址、电话号码、密码等。用户在与DeepSeek互动时输入的文字、声音、上传的文件、对话历史等也都可能被收集。
另外,DeepSeek也收集并储存用户使用的仪器的型号、操作系统、打字规律(keystroke pattern)和韵律、IP地址
DeepSeek的隐私政策称,如果为了“服从可适用的法律、法律程序或政府要求”,公司收集的这些数据可能会被分享给政府。
美国政府一直尝试停止北京获取美国用户的数据。此前,美国国会以国家安全为由通过了法案,要求母公司在中国的TikTok向美国公司出售或被下架。
“中国在人工智能领域的进步应该引起每一位美国人的深切关注,” 美国前国务卿迈克·彭佩奥(Mike Pompeo)在X上写道,“你提供给像 DeepSeek 这样的中国公司拥有的应用程序的任何数据,都可能被交给中国共产党。”
美国的科技公司同样收集这些数据,这也是美国不少学者和专家认为需要更多监管的一个领域。不过,“对华政策跨国议会联盟”(Inter-Parliamentary Alliance on China)行政总裁裴伦德(Luke de Pulford)在X上指出,这两者间有很大的区别。
“这与自由世界的社交媒体应用程序的区别在于,在法治国家,你可以维护自己的数据权利。而在中国,情况并非如此。” 他的帖文写道。
踩在西方AI发展的肩上,未来尚不可知
深度求索虽然规模不大且成立才不到两年,但已经受到了中国中央政府的重视。1月20日,深度求索的创始人梁文锋参加了由中国总理李强展开的一场座谈会。当天的《新闻联播》播出了梁文锋坐在会议中的画面。
过去几天里,中国媒体将报道的重点之一放在了深度求索团队的中国背景。创始人梁文锋毕业于浙江大学,没有海外留学和工作的经历。他的公司里的大多数人也都是普通的应届毕业生。
在2023年深度求索刚成立时,梁文锋对媒体表示:“如果追求短期⽬标,找现成有经验的⼈是对的。但如果看⻓远,经验就没那么重要,基础能⼒、创造性、热爱等更重要。从这个⻆度看,国内合适的候选⼈就不少。”
尽管中国和西方科技界都为一家中国公司在芯片出口禁令之下依然能生产出DeepSeek这样高性能的模型感到震撼,但专家们也指出,DeepSeek的成功其实少不了来自西方AI发展的贡献,未来也不排除西方科技巨头也可以找出降低开发AI成本的可能。
“现有的研究论文覆盖了高级AI模型各个方面的可用性,也使得 DeepSeek 能够迅速掌握最新进展,并在现有最佳方法之上进行创新。” 奥尔布赖特石桥集团的特廖洛表示。
“DeepSeek的最终成功将取决于诸多因素,包括其他开源领军者(如Meta)发布更强大模型的能力,以及降低训练和推理成本的能力。” 他补充说。
评论区