当前位置:首页 > 财富探索 > 正文

涂鸦智能发布PAM模型:毫秒响应、精准执行,重塑AI+IoT设备控制体验

AI硬件加速普及的今天,“听得懂”已成为大模型的标配能力,但“做得对”才是连接AI与物理世界的真正门槛。

尤其在智能音箱、智能中控、车载语音、家居机器人等高频控制场景下,用户的期待非常直接:既要快,又要准。

而这恰恰是当下通用大模型最难兼顾的一对矛盾:

追求极速的轻量级模型:首响时间够快,但面对跨品牌设备字典与复杂意图,指令准确率掉线;

追求高智力的大参数模型:准确率够高,但思考链路过长,无法支撑设备端“亚秒级”响应,用户喊完一句话还得再等几秒。

更关键的是,通用大模型在AI+IoT控制场景中还会卡在另一道断层上:理解到位,执行掉线。

检索拖累:依赖RAG在全屋设备字典里反复检索,链路一长,响应就慢;

思考冗余:通用大模型的CoT(链式思考)在控制场景属于“过度思考”,每一次开灯都要“想一想”;

指令幻觉:跨品牌、跨协议的设备指令字段不统一,常常出现“答得头头是道,灯却不亮、空调没反应”。

如何让大模型在“速度”与“控制准确率”这条钢丝上同时走稳,是AI+IoT走向真正“开口即控”的最大挑战。

01

涂鸦PAM:为物理世界执行而生的大模型

针对AI理解与设备执行之间的断层问题,涂鸦智能正式推出PAM(Physical Action Model,物理执行大模型)。

该模型由涂鸦智能AI算法团队基于真实IoT语料进行垂直优化训练,围绕全量Schema直推、无CoT极速生成、跨品牌精准映射三条主线,打破传统AI+IoT设备控制的技术范式,为全行业AI硬件构建了实时执行的技术底座。

简单来说,PAM能让AI在面对全屋几十、上百个异构设备时,依然能做到又快又准,实现低延迟、低幻觉、跨生态的稳定执行。

02

核心突破:四大硬核能力,全面重塑设备执行体验

围绕开发者在实际AI硬件开发中面临的复杂场景,涂鸦PAM模型通过技术路线的革新,带来了体验上的多重升级:

6d1b862a-6000-11f1-ab55-92fbcf53809c.png

架构革新:

零RAG+全量Schema,实现“开口即装入”的全屋认知

当前行业主流方案普遍依赖RAG检索完成设备字典查询,不仅链路冗长,而且在全屋设备规模扩大、品牌协议碎片化的现实环境中,检索延迟与错配风险会被进一步放大,直接拖累端到端体验。

涂鸦PAM模型从真实AI+IoT控制场景出发,创新性地采用超长上下文原生推理路线:将全屋设备物模型一次性载入模型上下文,摒弃运行时RAG检索;同时基于真实设备字典进行约束解码,在生成阶段就从源头压制指令幻觉,真正做到“开口即看清全屋、出口即贴合设备”。

体验突破:

无CoT+SLM架构,实现“肌肉记忆式”的极速指令

依托面向物理控制域深度优化的SLM(小语言模型)架构,以及对通用大模型冗余链式思考的剥离,PAM直接将自然语言转为结构化设备指令,形成“听清即输出、输出即可执行”的直觉式推理链路。

在真实业务环境下,该架构稳定输出了一组亮眼的数据:

模型决策时间P95≤220ms,首响显著低于业界通用大模型,真正做到“话音落、动作起”;

跨品牌设备指令精准映射准确率≥99%,字段一次对齐;

原生支持单/多意图精准拆解,复杂指令无需Prompt工程加持。

这种“无思考犹豫期”的极速控制能力,专为设备端极速响应定制,让AI硬件的交互流畅度,逼近用户对“按下开关”的直觉预期。

值得一提的是,从早期内部版本的0.481s,到正式发布的P95≤220ms,PAM决策耗时一路持续压降——这也是PAM数据飞轮“让模型与真实世界一起生长”的第一份实证。

生态原生:

跨品牌精准映射,实现“统一语义”的开放互通

跨品牌设备指令字段不一、协议碎片,是行业多年顽疾。PAM模型在设计之初,就将生态互通作为核心原则。

依托涂鸦多年沉淀的海量IoT真实语料,PAM完成了跨品牌、跨协议的统一语义对齐:无论是不同品牌的灯具、空调、扫地机器人,还是不同协议下的传感器、执行器,都能在同一套语义空间下被精准识别与调度。

这意味着,一句话调度全屋异构设备不再需要用户记住“哪个App控哪盏灯”,生态孤岛从底层被打通。在复杂家庭环境下,PAM展现出业务级泛化能力,稳健支撑真实体验。

边界自知:

诚实拒识,反幻觉的可信执行

在AI+IoT控制场景下,大模型最大的隐患往往不是“做错”,而是“假装做对”——听到陌生指令就编、明明不会还硬上,用户以为指令已经生效,实际可能错执行了完全无关的设备,或者根本没有任何动作发生。

PAM从设计之初就把“诚实拒识”作为基础能力,主动识别两类典型的边界场景,并给出明确反馈:

场景一:多指令中夹带不存在的设备

比如用户一句话说“打开客厅的灯、把空调调到26度,再启动客厅的烤箱”(而家中并无此烤箱)。通用大模型容易把“客厅的烤箱”硬匹配到一台微波炉或电磁炉,导致用户感知与实际执行错位。PAM基于全量Schema的硬约束,精准执行前两条真实存在的指令,并明确反馈“未找到客厅烤箱”——做到的事说做到,做不到的事直说做不到。

场景二:设备存在,但请求的指令越界

比如“把卧室空调调出童年回忆模式”,而该设备实际并不支持此模式或字段。PAM能识别出该指令不在设备的能力范围之内,主动告知“当前设备不支持此操作”,而不是强行映射到一个最接近的真实模式触发执行。这种“知所不能”的能力,本质上是反幻觉在物理执行链路上的工业级实现——少一次错执行,就少一次用户对AI的信任崩塌。真正可靠的物理执行能力,既要敢于行动,也要敢于说“做不到”。

03

生态赋能:即插即用,加速AI+IoT爆款诞生

作为涂鸦智能“物理世界AI基座”战略的重要组成部分,PAM模型将面向全球开发者开放集成。

通过涂鸦智能全栈开发平台,开发者可以快速将PAM模型接入到各类智能硬件形态中,重塑多场景下的执行体验:

智能音箱|单设备指令极速响应

最高频的“开灯、关空调、调亮度”等极简指令,是智能设备最考验“执行速度”的场景。涂鸦小智音箱接入PAM模型单指令端到端响应速度小于1.5秒——PAM让设备真正做到“话音落、动作起”。

智能音箱|单设备标准与泛化指令准确响应

用户既能说“把灯调成红色”这种精确指令,也能说“灯太亮了”、“有点暗”这种口语感受,PAM都能稳定转译为正确的亮度调节。

智能音箱|复杂多设备指令

组合控制、跨设备协同……复杂意图考验的不再是“反应快”,而是“听清+拆得对+执行稳”的综合能力。

对开发者或企业而言,这意味着:

无需从零构建:无需耗费高昂的研发成本去组建大模型团队、采购海量IoT控制语料、自训设备控制模型。

即插即用:依托涂鸦完善的AI+IoT全栈生态,硬件、云端与模型能力实现快速接入与高效调优,控制能力天然贴合设备形态。

缩短研发周期:极大降低了具备“理解+执行”一体化能力的AI硬件门槛,助力企业以极低的开发成本抢占全球AI硬件的市场先机。

PAM的价值,不仅在于让一盏灯亮得更快、一台空调响应得更准。更重要的是,它正在为AI与物理世界之间搭建一条稳定、高效、可信的执行通路。

从理解到行动,从生成内容到驱动设备,从数字世界走向真实世界。PAM,正在成为AI硬件时代的物理执行底座。