DeepSeek浪潮下,端侧AI的创新催化剂

在柏拉图的《理想国》中,有一个洞穴隐喻的故事:一群囚徒从小就被锁在洞穴里,他们只能看到墙壁上的影像,背后有一堆火,他们误以为这些影像就是真实的世界。

大模型也曾经历类似的“影子”误导,一度将大规模预训练模型视为唯一真理。直到2025年初,DeepSeek R1展现出的推理能力,让AI从“影子”阶段走向了以自省和辩证的方式追求真知。

DeepSeek让模型走出“洞穴”,改变智能终端的范式

DeepSeek蒸馏模型在推出不到两周后便成功在搭载骁龙平台的商用终端上运行,AI硬件不再是提升估值的“性感故事”,而是具有实际应用价值和商业潜力的技术。

高通最新发布的白皮书《AI变革正在推动终端侧推理创新》指出,DeepSeek的推出标志着AI进入推理创新时代,训练成本降低、快速推理部署和针对边缘环境的创新正在推动高质量小模型的激增,加速AI在边缘终端的部署。

清华大学副教授、面壁智能联合创始人兼首席科学家刘知远也表示,这种从“规模至上”到“效率优先”的转变,为端侧AI提供了重要启示:通过模型压缩、参数优化和算法创新,可以在保持模型性能的同时,大幅降低计算资源需求,使其适合在终端设备上运行。

使用DeepSeek蒸馏后的Qwen-7B模型,已经能够在性能上与去年推出的GPT-4o云端模型持平。

这意味着,许多只能在云端运行的大规模模型,能够部署到随身的终端设备中,在本地完成复杂的推理过程,甚至可能实现“满血”运行。同时,在端侧AI的新浪潮下,我们正在见证智能终端的又一次转折——从单纯的功能性设备到具有自主理解和行动能力的智能体(Agent)。

端侧AI的技术拐点:从“规模至上”到“推理创新时代”

两年前,比尔·盖茨发布了一篇博客,提到自己见证了两次革命性的Demo,第一次是1980年看到的图形用户界面(GUI),第二次则是在GPT-3.5推出前几个月看到的AI回答方式。

然而,作为普通用户,对这种改变的感知可能没有那么强烈。因为这种交互变革的载体离不开智能终端,就像iPhone将功能机时代的按键操作转变为触控交互,进而重塑了整个智能手机生态。

那么,在AI时代,这个载体是什么呢?

或许并不是一个全新形态的终端,而是智能终端带来的全新体验形式——从应用驱动向智能体驱动。

正如高通CEO安蒙在去年年底提到的新趋势,AI是新的用户界面(UI)。端侧AI的落地将改变传统的交互逻辑。

用户无需打开特定应用,AI智能体可通过多模态输入(语音、图像、视频)直接执行任务。这些功能背后离不开边缘侧AI的支持。

比如,荣耀Magic7系列中的YOYO智能体就需要终端侧AI处理能力的支持,搭载的骁龙8至尊版为终端侧提供了足够强的AI算力,能够在手机本地完成推理和理解等AI任务。

过去,端侧AI受限于硬件性能,而大模型的计算需求却在快速增长。虽然此前搭载骁龙8至尊版的智能手机已经能在端侧运行7B规模的模型,但针对一些复杂的生成式AI用例和高质量图像生成任务,仍然需要结合云端算力。

不过,端侧AI的技术拐点已经出现。高通的白皮书中提到的四大趋势包括:

  1. 当前先进的AI小模型已具备卓越性能,通过模型蒸馏和新型网络架构,性能已经超越一年前仅能在云端运行的更大模型。
  2. 模型参数规模正在快速缩小,先进的量化和剪枝技术使开发者能在保持准确性的同时减小模型体积。
  3. 开发者能够在边缘侧打造更丰富的应用,如文本摘要、编程助手和实时翻译。
  4. 将智能体(Agent)作为新的交互入口,个性化多模态AI智能体将简化交互。

异构计算架构:端侧AI的硬件基础

高通拥有三大业界领先的处理器单元,这些处理器对端侧AI的发展至关重要。

高通的Oryon CPU、Adreno GPU和Hexagon NPU相互协作,满足了生成式AI工作负载的需求,推动了端侧AI的创新。

高通通过将这些处理单元集成到终端设备中的异构计算架构,不仅能够在更低功耗下输出更高的算力,还能适应不同场景的AI处理任务。

软件:释放端侧AI潜能的关键

除了硬件算力,高效的AI软件工具栈也是端侧AI得以实现的重要支持。开发者可以利用高通提供的库、SDK和优化工具,简化模型部署,提升性能,缩短AI应用的上市时间。

例如,用户可以拿起手机识别食材,生成菜谱,甚至询问食物的卡路里信息,所有这些都可以在终端侧完成。

AI Hub:为开发者提供便捷的AI部署平台

高通的AI Hub为开发者提供了一个平台,可以选择合适的模型和框架,轻松在终端设备上进行部署。AI Hub支持包括Llama、Allam 3B、OpenAI等在内的多个预优化AI模型,推动了端侧AI应用的普及。

随着更多厂商加入AI Hub的生态系统,端侧AI的应用将更加广泛。

结语:端侧AI的未来

高通正在构建端侧AI的完整生态系统,成为端侧AI的“首席架构师”。正如宇文恺规划大运河一样,高通为端侧AI提供了统一高效的计算基础,推动了AI与各种终端设备的深度融合。