中国新兴科技公司DeepSeek是否抄袭了ChatGPT来制造本周震惊华尔街的人工智能技术?
ChatGPT开发者OpenAI以及美国总统唐纳德·特朗普(Donald Trump)的最高级别AI顾问确实如此认为。 两者都没有披露知识产权盗窃的具体证据,但这些言论可能会引发对一些假设的重新审视,而这些假设使得美国对DeepSeek的先进性感到恐慌。
“有大量证据表明,DeepSeek在这里所做的就是从OpenAI的模型中提炼出知识,”特朗普的AI顾问戴维·萨克斯(David Sacks)星期二告诉福克斯新闻。 “我认为OpenAI对此并不高兴。”
DeepSeek及其开发者幻方量化基金星期三没有立即回复通过电子邮件提出的提问,星期三是中国农历新年假期的开始。
OpenAI在一份声明中表示,中国公司“一直在试图提炼美国领先AI公司的模型”,但并未公开具体点名DeepSeek。
OpenAI的官方使用条款禁止使用所谓“提炼”的方法,可以让新的AI模型通过反复查询已经被训练过的更大的模型来学习。该公司一直在与其业务伙伴微软合作,以识别试图提炼其模型的账户,然后禁止这些账户并撤销其访问权限。微软拒绝向美联社(AP)置评。
OpenAI表示,它还将“与美国政府密切合作,以最好地保护最强大的模型,防止对手和竞争对手窃取美国技术。”
这家旧金山公司本身也被媒体组织、书籍作者和其他人士指控侵犯版权,这些案件目前仍在美国和其他国家的法院审理中。
“提炼会违反大多数服务条款,但讽刺甚至虚伪之处在于,大型科技公司却在强调这一点,”科技投资者兼康奈尔大学讲师鲁兹·费格(Lutz Finger)星期三发表声明称。“在《福布斯》(Forbes)或《纽约时报》(New York Times)的内容上训练ChatGPT也违反了他们自己的服务条款。”
曾在谷歌和领英工作的费格表示,虽然DeepSeek很可能使用了这种方法,但很难找到证据,因为它很容易伪装和避免被发现。
甚至在星期一DeepSeek的新闻震撼市场之前,许多试过该公司人工智能模型的人就注意到,它倾向于宣称它是ChatGPT或引用OpenAI的条款和政策。
“如果你问它你是什么模型,它会说,‘我是 ChatGPT’,最可能的原因是DeepSeek的训练数据是从数百万次与ChatGPT的聊天互动中收集的,这些互动直接被输入到DeepSeek的训练数据中,”前美国国防部官员、目前担任战略与国际研究中心(Center for Strategic and International Studies)瓦德瓦尼人工智能中心主任的格里高利·艾伦(Gregory Allen)表示。
此类声明并不一定意味着知识产权被盗--聊天机器人很容易捏造信息。尽管DeepSeek将称其技术为“开源”,但并未披露其用于训练模型的数据。
“我认为他们做出这一选择的原因非常明显,即他们收集了ChatGPT的内容作为训练数据,”艾伦说。
DeepSeek的很多方面让分析人士感到困惑,他们仔细研究了这家初创公司关于其新模型R1及其前身的公开研究论文。
令华尔街震惊的细节之一是DeepSeek声称训练其人工智能助手背后的旗舰v3模型的成本仅为560万美元,与构建ChatGPT和其他流行的聊天机器人所花费的数十亿美元相比,这是一个低得惊人的数字。
论文称,560万美元的数字仅包括实际训练聊天机器人的费用,而不是早期研究和实验的费用。但这个数字--以及DeepSeek对开发人员相对便宜的费用--让人怀疑美国公司投入巨额资金和电力发展AI是否合理。
DeepSeek也受到限制:美国对最强大的AI芯片实施出口管制。该公司表示,它依赖的是加州芯片制造商英伟达(Nvidia)的一款性能相对较低的AI芯片,而美国并未禁止该芯片在中国销售。但在2022年,幻方量化在社交媒体上发帖称,就在美国限制向中国出口英伟达芯片的几个月前,该公司已经积累了一批性能更强大的英伟达芯片。
(本文依据了美联社的报道。)
评论区