印度要做自己的DeepSeek:有芯片也有人,10个月内搞定
在硬件方面,印度认为自己还有优势。
DeepSeek风暴席卷全球,印度人也在狂喜。但这不仅仅是因为印度人喜欢用它。
据彭博社报道,自1月20日DeepSeek-R1模型正式发布以来,DeepSeek仅18天内累计下载量已突破1600万次,其中,印度下载量占所有平台下载总量的15.6%,成为DeepSeek新用户增长的最大来源。
分析认为,这反映出新兴市场对智能工具的旺盛需求——印度作为全球增长最快的移动互联网市场,其用户更倾向于尝试高性价比的AI工具。并且,这一现象也成功印证了“AI应用下沉”趋势,即技术普惠带来的市场扩张效应。
更重要的是,DeepSeek让印度人看到了一线曙光——在人工智能领域,别的国家也有机会。
受此启发,印度政府表示,计划在未来10个月内开发本土大语言模型,挑战DeepSeek与OpenAI。
“我们国家发射月球任务的成本只有别的国家的一小部分。为什么我们不能也建立一个低成本的AI模型?”2月5日,印度信息技术部长阿什维尼·维什瑙与到此访问OpenAI的联合创始人兼CEO奥特曼会面。维什瑙说,人工智能的发展可以在世界任何地方落地生根。
就在上周,维什瑙称赞中国人工智能初创公司DeepSeek以其低成本的人工智能助手,撼动了人工智能行业,并将这种节约的做法与印度政府建立本地化人工智能模型的努力相联系。
那么,印度若想创造出自己的人工智能模型,有可能吗?
奥特曼被打脸
时间回到2023年6月,彼时,风头正盛的奥特曼在印度参加一场活动。有印度投资人问他:“一个拥有1000万美元预算的小而聪明的团队,是否可以在AI领域做出实质性的成果?”
当时,奥特曼的回答是:“我会告诉你,想在训练基础模型方面与我们竞争,完全是没希望的。你能做的也就是尝试而已。我觉得你不应该尝试。”
如今,这段视频被媒体和网友们挖出,并热烈讨论。
路透社称,来自中国的DeepSeek引发世界轰动后,奥特曼的这番言论也成为了社交媒体上的焦点话题。法国企业家阿诺德·贝特朗不仅转发分享了这段视频,还重复写下了奥特曼的回答,并写道:“回想起来,这真是太滑稽了。”
法国企业家阿诺德·贝特朗的回复。(图源:社交媒体截图)
DeepSeek以相对低廉的训练成本以及开源的部署方式,得到了世界AI产业界的极高评价,也让印度人看到了希望。
“有人质疑印度政府在AI方面的投资规模。你们看看DeepSeek做到了什么?仅用了550万美元,就开发出一个非常强大的模型。这就是头脑的力量。”维什瑙说。
日前,奥特曼访问印度时与维什瑙展开了一场对话,他也首次回应了当年那段视频以及AI成本争议。
奥特曼改口强调,称他之前在视频里的话是被“断章取义”的。他认为印度会成为AI革命的领导者之一,因为他看到了“印度正在拥抱技术和构建整个AI生态方面所做的努力,是非常了不起的”。
至于研发成本,奥特曼认为:“对于AI的前沿性研究成本依然会持续性呈指数级别上涨,当然,单位智能成本会在未来一年内下降大约10倍,这个数字要超过了摩尔定律,目前半导体行业每年的成本下降大约在50%。”
10个月内,能准备好吗?
1月30日,维什瑙放出消息称,印度的大语言模型将在今年之内准备好。
维什瑙透露,随着基础工作已完成,印度政府目前正专注于打造一个符合印度独特需求的人工智能系统。他还称,预计该模型将“在未来10个月内准备就绪”,其基础框架已经到位。
据印度媒体报道,印度政府已经批准了18项提案,旨在加速农业和气候变化等关键领域的AI解决方案落地。这些支持措施包括提供算力、数据和资金。
维什瑙还透露,预计到今年年底,将有6家主要开发商推出基础AI模型。为使相关开发更加“经济且易于获取”,印度政府将补贴40%的计算成本,降低AI计算单元的平均费用,将目前每小时1.29美元的费用降到更低。
其实,近年来,印度政府在AI方面的投资并不少。
就在2023年,印度才成立国家级“印度AI使命”(India AI Mission)项目,旨在实现“让AI在印度扎根”和“让AI为印度服务”两大目标,预算达1037.192亿卢比(约合人民币86亿元)。
印度AI使命的负责部门(图源:该部门官网)
印度也努力成为世界领先的人工智能中心。包括微软、英伟达、亚马逊在内的大型科技集团都有计划在印度投资数十亿美元,建设云计算和AI基础设施。印度本土的阿达尼集团和信实工业公司也正在进行大规模数据中心投资。
甚至连贝莱德这样的资产管理集团,也计划招募近1200人,扩大在印度的两个支持中心,并在该国搭建AI能力。
作为衡量AI算力的一个重要指标,在超大规模数据中心数量上,截至2023年,印度只有大约18个超大规模数据中心,而中国的公开数据是有接近100个。差距背后,是支撑和维系数据中心运作的一系列配套设施,包括了电力、网络、冷却系统等。
对此,《日本经济新闻》称,印度显然仍有很大的发展空间。
印度还差什么
近段时间,印度媒体和专家们不断在讨论,印度离一个本土的DeepSeek,还差些什么呢?
印度人认为,差距并不是全方位的。甚至在硬件方面,印度还有优势。
据了解,印度现有超过18600个高性能GPU,其中12896个为英伟达H100、1480个是英伟达H200、742个为MI325和MI325X。
相比较之下,DeepSeek是在2000个GPU上训练完成的,ChatGPT是在25000个GPU上训练完成的,因而印度有超过18000个高性能GPU,可以说,印度的算力资源已经足够强大了,足以支撑印度大模型的需求。
《经济时报》和《第一邮报》还相信,印度在硬件和人力等软件资源上并不逊于中美两国。但仍然没有在AI领域创建一个创新生态系统。
有学者认为,这与思维方式有关,印度并不重视基础创新。
印度数据中心巨头Yotta的母公司CEO希兰南达尼认为,印度并不缺乏先进芯片,“但我们还没有创建一个创新的生态系统,这是一个思维方式问题”。
印度前电子和信息技术部国务部长拉吉夫·陈德拉塞卡尔同样称:“DeepSeek AI模型的出现表明,印度的计算能力永远无法成为长期的护城河……希望印度的人工智能初创企业能够在未来带来颠覆。”
印度专栏作家拉布罗也指出,印度应改变思维,敢于与世界领先企业竞争。“仅仅试图把别人创造的东西做好,并不能让我们成为一个突破性的国家。我们需要投资于有助于自身利益的尖端研究。”
还有观点认为,印度政府干预的缺位以及受保护市场的缺乏,也是印度企业怯于参与AI竞争的原因之一。
印度咨询公司Tracxn和印度人工智能协会的数据显示,过去4年,印度AI初创公司激增70家。但在AI大模型领域的公司不到10家,且业务主要集中在对话AI、智能助手等,基本不涉及基础模型的研发,只能解决相对初级的问题。
例如,印度独角兽公司Krutrim的自研模型Krutrim AI在使用时仅允许输入424个字符。而OpenAI的GPT-4,字符数上限已达到了32768个。
《第一邮报》认为,印度政府干预并为企业创建一个“受保护的市场”至关重要。
本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com