DeepSeek很强,但还不是革命?马斯克发声:很快会发布比Deepseek更好的模型
马斯克认为Deepseek不能算作AI领域的一次革命性突破。
图片来源:Pixabay
Deepseek的横空出世,无疑在全球AI领域掀起了一场风暴。该产品不仅在国内一直霸榜,还成功超过谷歌旗下的Gemini,成为全球第二受欢迎的AI聊天机器人。如此优异的表现吸引了全球各路人马的眼光,其中就包括特斯拉CEO马斯克。
日前,WELT经济峰会发布了马斯克采访视频,其中提到了大火的国产大模型DeepSeek。马斯克首先对中国工程师点赞,并指出中国拥有大量聪明且非常有上进心的工程师,所以应该预料到中国可以做出很多伟大的东西,DeepSeek只是这些伟大造物之中的一个,这其实是中国人才济济的结果。
但尽管如此,马斯克依旧认为Deepseek不能算作AI领域的一次革命性突破,在他看来,xAI(马斯克旗下AI公司)和其他AI公司很快就会发布比Deepseek更好的模型。
有着类似观点的科技大佬,不止马斯克一人。谷歌旗下人工智能实验室DeepMind首席执行官、2024年诺贝尔化学奖得主德米斯·哈萨比斯(Demis Hassabis)也在近期对DeepSeek作出点评。
哈萨比斯先是强调,Deepseek的AI模型可能是“我见过的来自中国最好的作品”。但随后他又指出,尽管Deepseek的模型展示了出色的工程能力,但从技术角度来看,这并非一项重大的变革:“Deepseek的模型并未带来新的科学进展,而是使用了已知的人工智能技术,外界对其的炒作可能‘有点夸大了’。”
哈萨比斯还称,谷歌上周向公众发布的Gemini 2.0 Flash模型要比Deepseek的模型更为高效。
事实上,任何一项新的技术突破在推动边界的同时,也会暴露出新的问题,并因此面临质疑。两年前,在ChatGPT横空出世,并以其惊艳的语言理解能力引发全世界关注的时候,也有类似的观点出现。2023年初,Meta首席人工智能科学家杨立昆(Yann LeCun)也曾在一次小型媒体和高管在线聚会发表了自己的看法,他认为ChatGPT并没有什么特别的创新,也不是什么革命性的东西。
但事后回看,ChatGPT的出现无疑为人工智能产业的发展带来了新的范式革命,自那之后整个产业都在向生成式AI迁移。
而以极低成本出圈的Deepseek,或许也有望创造同样的神话。
公开资料显示,Deepseek成立于2023年5月,至今不到两年,其背后是国内对冲基金巨头幻方量化。2024年5月,Deepseek发布开源的第二代MoE大模型DeepSeek-V2。该模型在性能上比肩GPT-4 Turbo,价格却只有GPT-4的百分之一,DeepSeek由此被开始称作“价格屠夫”“AI界的拼多多”,吸引市场广泛关注。
2025年1月,Deepseek推出的R1模型,更是在数学、代码、自然语言推理等任务上与OpenAI-o1-1217基本持平,尤其在AIME 2024(美国数学邀请赛)、MATH-500、SWE-Bench Verified(软件开发领域测试集)三项测试集上以微弱优势取胜。
而这一切,是在不到600万美元的投入下完成的。这种“四两拨千斤”的模式,颠覆了人们过往对大模型行业“大力出奇迹”式的固有认知,也有望为整个大模型产业的落地提供新的加速器。
(时代财经谢斯临 综合自财联社、界面新闻、新智元、IT之家、经济观察报等)
本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com