阿里巴巴AI“狂奔”:通义千问全球下载量破4亿,一周开源三大模型

郭美婷
2025-07-28 17:09:28
来源: 时代财经
AI赛道上,阿里巴巴正在“狂奔”。

“2019年,我们还在讨论单点突破的语言模型;到2025年的今天,大模型已呈现‘周级迭代’的爆发态势。”在WAIC 2025上,阿里云副总裁、大数据和智能实验室负责人叶杰平表示,当前AI模型技术正经历从“渐进式创新”到“指数级跃迁”的转变。

在今年WAIC的展区里,阿里巴巴(09988.HK;BABA.NYSE)展示了从AI基础设施到大模型再到平台及应用的“全栈AI”能力,陈列了云原生CPU芯片倚天710、飞天云计算操作系统、智算集群网络架构HPN7.0架构、AI Stack一体机等底层硬核技术,通义千问及通义万相大模型系列,以及阿里云百炼、人工智能平台PAI等大模型平台和夸克、钉钉等AI应用。

图源:企业供图

这其中,包括最新开源的三款大模型:千问3最新版基础模型(非思考版)、千问3推理模型、AI编程模型Qwen3-Coder。值得注意的是,这三款模型均是在一周内宣布开源。

AI赛道上,阿里巴巴正在“狂奔”。按照预算,未来三年,这家巨头还将投入3800亿元,主要用于建设云和AI硬件基础设施,总额超过去十年总和。

一周内开源三款模型

“三年前,我们发布了通义大模型,并承诺将核心模型开源开放。如今,通义千问已实现全尺寸、全模态的全面开源,真正打破了开源与闭源模型之间的技术壁垒。”叶杰平称。

开源一直是阿里云发展AI的主题词,这一思路在今年由DeepSeek翻起的开源浪潮下愈发得到验证。

据了解,千问3最新版基础模型(非思考版)性能有显著提升,在GPQA(知识)、AIME25(数学)、LiveCodeBench(编程)、Arena-Hard(人类偏好对齐)、BFCL(Agent能力)等测评中表现超越Claude4(Non-thinking)等闭源模型。

千问3推理模型支持256K上下文长度,在知识(SuperGPQA)、编程(LiveCodeBench v6)、数学(AIME25)、人类偏好对齐(Arena-Hard v2)、创意写作(WritingBench)、多语言能力(MultilF)等核心能力上,千问3推理模型可比肩Gemini-2.5 pro、o4-mini等闭源模型。

AI编程模型Qwen3-Coder则是千问系列模型中首个采用混合专家MoE架构的代码模型,总参数达480B,激活35B参数,原生支持256K token的上下文并可扩展至1M长度,能帮助程序员完成基础编程任务,比如写代码、补全代码、修Bug等。

海外模型API聚合平台OpenRouter数据显示,上述三大模型开源后,阿里千问API调用量暴涨,三天突破1000亿Tokens,热度超越GPT、Gemini、Claude等模型,千问包揽OpenRouter趋势榜前三名。截至目前,通义千问在全球主要模型社区的下载量已经突破4亿,衍生模型突破14万个。

阿里云百炼高级产品专家徐志远在接受时代财经等采访时谈到,千问系列模型在诞生之初就面向全球市场而非局限于国内市场。国内市场方面,依托国内庞大的市场空间以及阿里云自身的公共云基础产品,阿里云更多通过API服务或低成本模式为用户提供支持。而在全球市场,若要参与竞争并实现模型能力的对比排序,开源是极为重要且有效的方式——它能让全球开发者成为反馈主体,提供关于模型的直接反馈与信息,帮助阿里云准确判断模型在全球市场的真实水平。

事实上,阿里巴巴在开源上的相关实践获得海外认可也比在国内更早。徐志远谈到,“(在开源过程中)我们收到了全球开发者的反馈,这类反馈在商业场景中往往难以如此直接获取,因为在开源生态中,开发者与我们并无绝对利益绑定,他们的反馈仅基于对模型问题的判断,供我们参考迭代。”

20万开发者、70万Agent

阿里云百炼是全链路大模型服务与Agent应用开发平台,据介绍,目前已有超20万开发者在百炼上开发了70多万个Agent。

徐志远表示,阿里云百炼目前核心包含三个层面的服务:第一个层面是基础层,即结合阿里云广泛的基础设施以及可调度的AI算力,将模型转化为可供调用的高性价比、高性能API,也即“model service”(模型服务)层。

第二个层面是 agent(智能代理)层,在模型服务层之上,阿里云百炼整合了部分领先的agent框架与架构,为agent的开发构建提供一整套支持能力。在该层面,阿里云百炼提供包括兼容金融领域主流的ATO协议、MCP协议,以及支持阿里全栈自研的agent模型调度能力等。

第三个层面是AI大模型行业及领域应用层。在阿里云百炼上,开发者通过agent搭建基础能力后,可进一步构建一系列行业及领域应用。目前,电力、互联网、医疗、金融等行业,均已基于相关能力构建出面向企业内部及企业客户的各类应用。

据徐志远介绍,在阿里云百炼服务的企业中,其中一个核心场景是多元异构复杂数据的处理。他举例解释,在如招聘平台等互联网平台上,每天会产生大量视频、音频、文档等,企业需要通过不同模态模型将内容转化为所需数据,并对这些内容进行结构化提取、入库、向量化或打标,以便用于下游的推荐匹配、分析解析等业务场景。

第二类是企业内部助理相关的应用,面向企业员工、内部子部门等提升生产效率。其他应用场景还包括以图搜图、以视频搜视频、IPC(网络摄像机)等。例如,过去的IPC只有摄像头组件,仅具备记录功能,无法自主分析。而如今多模态模型不断发展,尤其是轻量化多模态模型的出现,尺寸更小,使得大量上游厂商可以在IPC中内置多模态模型,让设备能基于监控画面快速判断是否存在异常。今年3月,阿里巴巴就与KUMEROS咖啡达成战略合作,为后者提供从门店运营到产品创新的全链路解决方案。

徐志远进一步补充,具体到百炼服务企业客户,目前头部是互联网行业,这是因为大量互联网公司本身就以新技术驱动业务增长;其次是新消费行业,如咖啡门店等能在小程序等用户触点中融入 AI 能力,帮助用户更好地完成消费,还依托自身基础设施在内部业务中落地相关应用。

徐志远还着重提到了消费电子领域,未来多模态组件等融入模型后,如AI玩具等AI消费设备有望实现增长。“近期我们已经看到该行业涌现出大量需求,也正在做丰富的适配工作,以提升消费电子行业对模型的应用能力。”徐志远说。

本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com

相关推荐
京东AI爆发:“狂扫”机器人赛道后,官宣与数十家机器人品牌达成合作
从渠道困局到“黄金时代”,独立游戏大热的背后逻辑是什么?
对话商汤科技首席科学家林达华:生成不等于完成,AI创作的关键是理解人的意图
落地工业场景,大模型要闯这三关?
扫码分享