落地工业场景,大模型要闯这三关?
一是高质量数据收集困难,二是模型幻觉难以容忍,三是场景适配难以规模复制。
2025年世界人工智能大会上,“AI赋能新型工业化”成为最具现实张力的热词之一。从生成式AI到具身智能机器人,从工业操作系统到行业大模型,AI正试图一步步打通底层设备、中层系统与顶层决策的纵深链条。
据麦肯锡调研显示,今年1月评选出的全球17家“灯塔工厂”中,AI帮助其在制造成本、生产周期时间和缺陷率等方面改善50%以上。然而,这些工厂中排名前五的用例有77%应用到判别式AI,仅有9%应用到生成式AI。
咨询公司Gartner预测,到2029年,中国60%的企业将把AI融入主要产品与服务,并依托其成为核心营收驱动力。但从“实验室”走进“车间地板”,AI要穿透工业体系的多样性、复杂性和高可靠性要求,至少还有三座“硬山”需要翻越:一是高质量数据收集困难,二是模型幻觉难以容忍,三是场景适配难以规模复制。
这不仅是一场算法能力的竞赛,更是一场工业理解力与系统工程力的长跑。
高质量数据是前提条件
在通用大模型迈向工业场景的过程中,高质量数据不是加分项,而是决定模型能否落地的前提条件。
中国电子信息产业发展研究院信息化与软件产业研究所发布的研究报告指出,海量高质量数据是大模型泛化涌现能力的基础。从行业前沿趋势来看,大模型训练使用的数据集规模呈现爆发式增长,对训练数据的数据量、多样性和更新速度方面也提出更高的要求。
从国际演进轨迹来看,模型训练的数据规模正急剧膨胀。GPT-1的数据集为4.6GB,GPT-3达到753GB,而GPT-4的数据量是前者数十倍。据推测,GPT-5的训练数据有望突破200TB。
工业场景下,这一挑战更为复杂。国金证券研报指出,工业领域涵盖广泛,包括41个工业大类、207个工业中类、666个工业小类,导致数据结构多样,数据质量参差不齐。同时,由于工业生产过程中的各个环节相互交织,数据之间的关联性和复杂性也较高。数据来源、采集方式、时间戳等都会影响数据的准确性和完整性。
这种数据结构的多样与质量的参差不齐,给工业大模型的训练和应用带来挑战。工业 AI 构建,需要投入大量的时间和资源进行数据清洗、预处理和校验,以确保数据的准确性和一致性。
“当前很多企业在IT层面已经沉淀了大量数据,例如ERP、MES等系统数据,但在OT(操作技术)层面的数据积累仍有明显短板,尤其是在设备加工、运输、装配等底层环节。”在2025世界人工智能大会上,卡奥斯物联科技股份有限公司副总经理谢海琴向时代周报记者表示,“随着柔性制造、自动化制造趋势的加速推进,这部分OT数据的采集变得尤为关键。”
谢海琴表示,卡奥斯的做法是“从问题出发反推数据”,即先识别关键业务问题,明确所需数据要素,再去补齐采集路径,从而确保数据不仅齐全,而且精准。
“数据治理是一个‘久久为功’的系统工程,不仅要清洗、分类、建模,更需要在组织机制上为数据要素注入真实业务价值。”谢海琴强调,“如果数据质量不过关,无论是采集端还是清洗端,训练出的模型也无法具备工程可用性。”
控制模型“幻觉”风险
相比消费互联网可容忍一定程度的生成误差,工业场景对模型“幻觉”的容错率几乎为零。任何一次看似无害的偏差,在工业现场都有可能演化为实质性的安全风险或经济损失。
国泰君安证券研报指出,AI 幻觉(AI hallucinations)是指人工智能模型生成的看似合理但实际错误的内容,这种现象通常表现为脱离现实、逻辑断裂或偏离用户需求的输出。
大语言模型(LLM)在生成过程中可能感知到人类观察者无法察觉或不存在的模式或物体,从而产生毫无意义或完全不准确的输出。这些错误的成因复杂多样,包括训练数据不足、模型过拟合、数据偏差、错误假设以及上下文理解不足等。
谢海琴认为,控制幻觉必须从三方面入手:提升数据质量与行业理解,高质量、高可信度的数据集是模型可靠性的基础,背后必须有对行业工艺流程的深刻洞察; 引入外部知识体系,通过知识图谱、专家规则库等形式增强模型语义理解与推理能力; 引入模型校验机制,在模型推理之后增加交叉验证、专家审校或预测校验等机制,防止模型“跑偏”。
在产业实践中,企业正尝试将幻觉风险前置治理。在2025世界人工智能大会上,范式集团高级副总裁柴亦飞向时代周报记者表示,工业决策场景对可靠性要求极高,任何预测错误都可能导致实质性损失。因此公司在设计中引入决策模型,通过工程逻辑、业务规则对模型输出进行“约束校验”,最大限度地降低幻觉风险。
国金证券则提出一种可行架构:“大模型指挥、小模型执行”。即在需要全局优化和预测性分析的场景中,利用大模型进行宏观指导与决策支持。而在具体执行与实时反馈方面,则依靠小模型发挥其高精度和低成本的优势。
化解定制化适配难题
消费领域的大模型更关注“广覆盖”,而工业领域的大模型则必须直面“深穿透”的难题。
工业互联网的核心特征是“1米宽,百米深”。谢海琴表示,无论是流程工业还是离散工业,每一个细分行业的工艺流程都高度专业化、个性化,行业know-how极为深厚。这也意味着平台型企业若要真正实现能力穿透,必须基于深刻的行业理解展开定制化适配。
卡奥斯自身的演进路径印证了这一判断。谢海琴指出,卡奥斯起源于离散制造业,早期深度服务家电、电子、电脑等产业,并在激烈市场竞争中积累了扎实的工业基础。这些经验不仅帮助卡奥斯打下工业数字化底座,也构成其拓展其他离散制造门类的重要支撑。
在“工业具身智能”领域,定制化同样是穿透场景的前提。优艾智合联合创始人赵万秋向时代周报记者表示,具身智能的价值不仅在于自动化效率,更在于其对柔性制造趋势的支撑能力。“以手机制造为例,从过去一两个型号到现在每代手机都可能有普通版、Pro版、Max版等多种配置和颜色,消费者个性化需求的提升正在倒逼生产流程柔性化。”
赵万秋指出,优艾智合构建的面向工业实际需求的具身智能系统,正是支撑这种变化的基础设施。借助具身智能机器人及其调度系统,工厂能够实现物料在不同生产节点间的智能流转与动态调整,满足多品类、小批量、高频次的定制化生产需求。
算法层面的适配挑战同样不容忽视。柴亦飞表示,公司在实际应用中面临的最大挑战之一,是每类场景的数据结构和特征往往差异巨大。此外,在工程实践中也会对模型进行“封装”式的适配,不同应用场景所接入的大模型虽然底层一致,但调用方式、输入输出接口都可以做出差异化设计。
与通用大模型主要处理文本输入输出不同,第四范式(06682.HK)的垂直模型更偏向任务导向型。例如,在“办事型”场景中,大模型的核心作用不是生成文本,而是预测“下一个动作”或“下一个状态”。以在制造环节中的产量需求预测为例,模型的任务就是根据当前的多维数据输入,预测明天的生产需求。这种预测类应用本质上更贴近“广义智能决策”,而非纯粹的语言生成。
本网站上的内容(包括但不限于文字、图片及音视频),除转载外,均为时代在线版权所有,未经书面协议授权,禁止转载、链接、转贴或以其他 方式使用。违反上述声明者,本网将追究其相关法律责任。如其他媒体、网站或个人转载使用,请联系本网站丁先生:news@time-weekly.com