智能终端的发展历史上,芯片始终扮演着关键角色,芯片之所以成为推动智能终端发展的重要动力,得益于每次芯片性能升级能带来的生产效率提升。时间来到2023年,AI大模型爆发出了超乎想象力的应用效果,产生了明显的智能涌现效应。以AI技术激发第四次工业革命,带来新的生产力大发展,成为全球关注的普遍议题。在这样的时代中,智能终端AI化的趋势看起来已经势不可挡。为了能够让智能终端的AI发展适配智能化生产力需求的崛起,我们迫切需要一颗更强大的“芯”。
在这样的背景下,高通在今年的骁龙峰会上,发布了两款新品,第三代骁龙8和骁龙X Elite ,分别在智能手机和PC代表的智能移动设备上,实现了百亿参数大模型的本地运行,赋予了移动终端更智能的能力。
AI,移动芯片效率的倍增器
过去一段时间里,移动芯片的升级迭代思路非常清晰,在工艺制程上的稳步提升,让芯片在性能方面不断增长。所以,是先有芯片,继而才有了消费者用到新的电子产品,芯片是智能设备发展链条的起点,既能定义产品的性能,也能锚定行业发展的方向。
但随着万物互联、5G、人工智能等技术的快速发展,扩展了智能设备对于芯片的需求范围,比如人工智能提出了更多样化的芯片需求。支持人工智能的GPU、NPU,更低功耗低成本通信芯片、功能芯片等,快速增长的多样化需求成为芯片产业发展链条的新起点,这也意味着移动芯片领域迎来了全新的发展阶段。
在这个全新阶段中,高通凭借极具前瞻性的战略目光,早早就将AI作为芯片发展的关键能力。早在2015年,高通公司已经在移动平台中发布了支持异构计算的高通AI引擎,能够调动整个芯片的能力,用AI来增强图像、音频和传感器的运算。此外,在2016年高通还发布了骁龙神经网络处理引擎工具包(SnapdragonNeuralProcessingEngineSDK),这款SDK允许OEM厂商在智能手机、安全摄像头、汽车和无人机等骁龙820设备上运行自己的神经网络模型。至此,下游厂商可以基于骁龙芯片的AI能力定制化开发,比如用 AI 来增强图像、音频和传感器的运算等。
在经过了多年的技术积累,从第一代骁龙8开始,高通公司便愈发重视芯片的AI算力,率先支持了INT8精度整数计算,实现张量加速器计算性能翻倍;而在第二代骁龙8上,AI性能再次整体提升了4.35倍。AI能力的不断提升,帮助下游厂商的拓展了终端开发场景,还大幅提升了终端产品的运行速率,使得完成同样的操作,需要的反应和计算时间显著减少,这也使得AI成为了如今芯片最关键的基础能力。
骁龙打开移动芯片AI的新边界
对于高通来说,不断提升芯片性能不是创新的最终目的,以芯片为基础真正提升智能设备的生产效率,变革用户的设备使用方式和使用体验才是。因此在高通眼里,在这个全面提升移动终端体验的全新发展阶段,AI的作用是无法替代的。在消费者眼里同样如此,过去芯片评测往往只突出性能,主频、跑分、帧率。而现在普通消费者对芯片AI的重视也在与日俱增,AI能力正在成为消费者关注的重要内容。
因此,充分利用技术优势,在芯片方面实现AI能力的进化,不断推动AI技术在终端侧演进和扩展,成为了高通芯片升级的主要航向。今年年初,高通演示了它们强大的终端侧AI能力,在手机上运行超过10亿的AI模型StableDiffusion,并且生成图片速度能控制在15秒内。
时间来到10月份,搭载第三代骁龙8处理器的终端,不仅能在本地跑起百亿参数大模型,同时利用StableDiffusion生成图片的速度仅仅需要0.6 秒。如此巨大的提升,离不开高通AI引擎的核心,也就是升级了全新微架构的HexagonNPU。它性能提升了98%,能效提升了40%。此外,HexagonNPU还集成了硬件加速单元、微切片推理单元、性能加强的张量/标量/矢量加速器单元,同时所有单元共享2倍带宽的大容量共享内存。
这代表着,用户可以在搭载第三代骁龙8的终端上,利用AI能力自由实现生成图片、文本等内容的生成式AI体验,提升用户在终端设备上的创造性和生产力。对此,高通公司高级副总裁兼手机业务总经理ChrisPatrick表示:“第三代骁龙8平台将开启生成式AI的新时代——赋能用户创作独特内容、帮助生产力提升,并实现其他突破性的用例。”
手机芯片战场之外,骁龙还对PC市场寄予厚望。此次骁龙峰会上,高通还发布了面向PC产品的骁龙XElite,它同时也是高通将AI带到端侧的关键一步棋。
骁龙X Elite基于定制的Oryon CPU核心,相同功耗下CPU性能可达到x86处理器竞品的2倍;峰值多线程CPU性能比Arm架构处理器苹果M2芯片高出 50%。GPU方面,与性能领先的x86集成GPU相比,骁龙X Elite的性能领先高达80%。
而在最重要的整体高通AI引擎AI算力方面,则是达到了75 TOPS,相较2017年性能提升了约100倍。不仅是算力升级,骁龙XElite还集成了高通传感器中枢,集成MicroNPU和始终感知的ISP。值得一提的是,骁龙XElite也是首个集成始终感知ISP的PC处理器。
超强的算力,让之前只能在云端获得的生成式 AI体验,可以成功在搭载了骁龙 X Elite 芯片的电脑本地环境中运行。据介绍,骁龙 X Elite最高可以在PC 端运行高达 130 亿参数的大语言模型,Token 生成速度达到每秒 30 个。此外,高通还表示,未来在PC端,端侧AI将直接从本地提升用户的具体使用体验,即便是没有网络连接,AI也始终在用户身边。
一面扩大芯片AI能力的演进,一面将处理器的壁垒会打破使其走向更多智能终端,骁龙正在打开芯片创新的新边界。
高通加速驶向端侧AI
不难发现,芯片行业已行至十字路口,拥有更强大的性能只是基本功,而拥有强悍的AI能力,才能承载起引领下一个时代的重任。而在高通眼里,端侧AI是未来发展的主要方向。
因为,相比依赖云端的传统AI服务,终端AI具有独立性高、响应速度快、安全可靠等明显优势。
首先,从响应速度来看,使用云端生成式AI的过程中,需要面对需求高峰期时的高时延,而端侧AI不会出现这样的问题,在搭载了最新骁龙芯片的终端上,StableDiffusion生成图片时间不足一秒。而在网络不良的情况下,本地设备的 AI 能力就成了用户的唯一选择,这便是端侧AI的首要优势。
其次,从安全角度看,终端AI数据都存储和处理在用户自己的设备中,避免信息外泄的风险。此外,凭借安全芯片和加密算法,能更有效保护用户隐私。这也是其优于云端服务的重要原因。
另一方面,AI通过学习用户本地设备上长期累积的个人行为模式和偏好,能够深入了解用户需求,提供高度个性化的智能服务。它理解用户的语言习惯,上下文环境,为用户节省大量时间成本。这是实现真正“助手”本质的必然要求。
写在最后:对于未来,高通公司CEO安蒙表示:“AI 的预测能力,加上终端是专门为你打造的,这就让终端和操作系统,以及应用和云端变得智能。”可以预见,随着骁龙在终端侧AI能力的演进,未来骁龙的AI 能力,将很快从 PC 、手机转移到更多智能终端上,这意味着智能设备以AI为索的第四次工业革命的大幕正徐徐拉开,骁龙塑造的新时代,也在顺势到来。