11月5日,消费硬件领域有了重要的人事变动,Meta AR眼镜业务负责人Caitlin Kalinowski正式加盟OpenAI,担任机器人和消费硬件负责人。媒体评论称,“这预示着OpenAI不仅要在软件领域称霸,更野心勃勃地想要通过硬件产品重新定义人机交互的未来”。
如今市场中已经出现了一些基于AI技术的硬件产品,巨头入局,会让这个市场发生什么样的变化?究竟哪些因素影响着消费硬件的发展走向?具备什么样优势的硬件能够一枝独秀,避开与电脑、手机这类强势通用设备的竞争?
借用桥水基金创始人瑞·达利欧(Ray Dalio)的一句话:“历史虽不完全相同,但历史的模式常常重复。”或许我们能从早期硅谷软硬件企业的创业创新中,为当下的AI硬件创新找到一些思路。
冰鲸科技创始人潘鑫磊详细研究了硬件行业的发展历史。在梳理了1980年代的芯片革新、PC的起步与渗透、1980-1990年的Dos与Windows 1.0系统变化之后,他发现芯片、系统、应用以及人机交互方式这四个关键因素不断迭代,相互促进,深刻影响了PC产业的生态演进。
回到当下,AI大模型的出现,让四要素发生了变化。在芯片层面,GPU、TPU等芯片让算力不断提升;在系统层面,大模型可能会逐渐与系统融为一体;在终端层面,用户与设备交互产生的私有化数据会更有价值;前三个要素的变化,也会催生出新的应用。我们或许会见证一种全新的存算一体的计算设备的诞生。未来,它的地位可能与手机、笔记本,甚至公有云都有所不同。
我们将潘鑫磊在峰瑞的内部分享编辑成文,峰瑞资本投资人孟长洁在文末补充分享了对AI硬件领域的投资思考,希望能提供新的视角。
一、PC崛起、信息化进程,与硬件发展四要素
20 世纪 80 至 90 年代,是PC崛起的第一个头十年。PC行业的发展可以被简单概括为:始于硬件,兴于应用,终于生态。
这一时期的前五年,芯片技术的突破、IBM PC的发布、再到WordPerfect 等大量生产力应用的繁荣,推动了PC上半场的蓬勃发展。在下半场,GUI(图形交互界面)与图形应用崛起。在“激烈厮杀”中,微软逐渐成为“生态级玩家”,其发布的Office,逐渐吞并原有应用层的产品,为1990-2000年的第二曲线打下了扎实基础。
梳理PC硬件发展的过程中,我发现了四个关键因素,分别是芯片、系统、应用以及人机交互方式。这些关键因素不断迭代,相互促进,深刻影响了PC产业的生态演进。
硅谷的1980年代:群星闪耀时
今天OpenAI、Google和微软在定义基于大模型的“智能时代”。如果我们回到1976年PC诞生所构建的“信息时代”早期,那是Apple I诞生的时刻。这台电脑是由乔布斯和沃兹尼亚克在一个名为Homebrew Computer Club的极客社区中发布的,定价666美元。
当时的Apple I在极客社区里的发布,就好比今天新产品在Kickstarter发起线上众筹。这台电脑只面向极客用户,需要手动组装零件,早期销量不过200多台。但这款产品奠定了苹果的基石,帮助乔布斯和团队积累了第一批种子用户。
紧接着,苹果在1977年发布了Apple II,这一代产品不仅在外观上更为精致,增加了彩色显示,还加上了扩展插槽和一体化机箱,让极客们更容易扩展和DIY,其他核心规格其实没有太大变化。Apple II的发布是个里程碑,它定价1250美元,远低于当时价格高昂的商用计算机。
4年后,IBM的行动有些耐人寻味。据说IBM迫于市场压力,派出一个12人的精悍小团队,以行业老大的姿势,启动代号“Project Chess”的项目。作为当时的领军企业,自然需要掷地有声。他们推出了IBM PC。IBM PC基于Intel处理器,采用开放式硬件架构。
IBM这一举动毫无疑问是划时代的,定义了整个PC产业的开放标准,为所有其他厂商制造兼容设备打开了大门。从这个角度看,如今Facebook开放Oculus设计给第三方厂商,似乎也是相似的逻辑。
故事的另一面,IBM与微软的系统合作,也为后来事情的变化埋下了种子。如今互联网领域最重要的生态体系之一——Wintel生态(由Intel的芯片和Windows系统构成的)发端于此,但后来IBM在这个故事中逐渐“没了姓名”,我在下文接着展开。
再回到硅谷的1980年代,康懋达国际(Commodore International)也是一家值得关注的公司,虽然它没有走得很远。但在早期,它采用了几个关键策略。1982年,它以595美元,高性价比的定位,推出了康懋达64(Commodore 64)新款计算机。
这款产品具备当时领先的图形和音频处理能力,受到用户欢迎。同时,Commodore不止着眼美国,还优先开拓欧洲市场。依托欧洲当地的分销网络和广告投放,这家企业一度过半的收入来自欧洲,为其占领全球家用电脑市场奠定了坚实基础。
为什么苹果、IBM以及康懋达国际能够把个人电脑的价格“打下来”?
关键是芯片。毫无疑问,芯片是PC产品的基础,如同当下Nvidia以及云平台助推了OpenAI。PC产品的发展离不开芯片成本持续下降和“刚刚好的”算力。只有电脑做到适合用户使用而且价格合适,才有机会进入大众市场。
IBM PC最早采用的Intel的8088芯片就是个典型例子。8088相比前代 8086在总线位数上做了调整,成本因此得以下降,这也让它成了IBM PC 的核心芯片。
一个有趣的细节是,早年PC里的8位处理器,计算性能完全比不上现在的 ARM 处理器,和你家电冰箱或微波炉的显示器相当。也就是说,1980年的计算机,实际上就是你家电冰箱的计算水平。回头看,早期的电脑并没有大家想象中的那么强大,就为整个PC产业和互联网的发展奠定了基础。
其实,当时IBM主打的商用和军用计算设备非常庞大,算力也较强,但面对个人PC市场,或许没必要那么“硬核”,IBM选择了“降维打击”。8088则正好拉低了一个档次,带来了平衡的算力,同时成本也更低。8088芯片有点像今天的NAS,把商用服务器简化到更适合家用的算力和体积,让个人也能拥有小型计算解决方案。
如果说,今天英伟达的H200是商用的领导者,那AI PC或者AI NAS将模型带入各个计算终端的ASIC芯片会是谁在研发?我观察到,目前在AI芯片领域,峰瑞投资了一些企业,它们致力于研发下一代针对大模型场景的算力芯片。
在用户运营方面,就像今天围绕着大模型,在Reddit上有ChatGPT,LocalLLM,Stable Diffusion等一众子频道。每个时代的早期,大量杰出的人才和想法都源于线上线下社区。
这对今天的中国也没有那么陌生,因为早年的互联网进来的时候,也有很多大佬跑深圳,混迹于BBS里面,然后分散到各个产业里面。今天清华系的创业者们,围绕着大模型,也有类似属性的线上线下空间。
然而,重要且有趣的一件事是,这些社区会在长达 10 年的发展过程中逐渐消失。它们的“宿命”,是在创新活跃时极度繁荣,但等到行业成熟、巨头出现时,其热度逐渐消退。像Homebrew Club,包括今天的模型产业、3D 打印、四轴飞行器,都是这种“先兴后退”的模式。
系统的演进:每一代系统,都标榜自己“友好的交互界面”
芯片在硬件层面提升PC,操作系统则在软件层面重塑PC。
就像今天基本上只有算法工程师能“fine-tune”模型一样,大概在1979年,仅有万把硅谷工程师在捣鼓 DOS 系统(Disk Operating System,磁盘操作系统的缩写,是个人计算机上的一类操作系统)。那时DOS系统完全是基于代码命令行操作,还没有图形界面。彼时,操作系统还远远没有渗透到企业和大众用户的日常使用中。
直到1981年,随着IBM推出首代PC,DOS系统逐渐获得了更多的关注,但它仍然是不带GUI(图形界面操作系统)的命令行版本。所以,当时的计算场景跟现在的AI很像:需要大量技术极客和工程师反复调整、整合,才能做成具体的应用。
真正让PC和操作系统触达企业端的是施乐公司(Xerox)发布的“施乐之星”。这是世界上率先能实现商用的,拥有GUI的计算机。它有比特位屏幕、图形界面以及鼠标,并且可以访问电子邮件。GUI让PC迎来了第一波大众用户的增长。
1984年,苹果推出的GUI进一步将使用场景扩展到创意、教育等细分领域,让操作系统进一步向大众普及。
值得一提的是,在PC发展的头十年,DOS系统和GUI系统并存了很长时间,不少PC公司同时要维护两套系统,以满足不同场景的需求。DOS和GUI的目的是一致的,都是为了操作设备,但是面向的受众不同。前者以命令进行操作,但更轻量化,更针对专业用户,后者以图形界面进行操作,更大众化。
1980年的早期应用生态,今天我们眼中的“Killer App”
伴随着系统和电脑硬件能力的提升,早期应用逐渐发展起来。日渐丰富的应用,推动更多的企业与个人用户接触、购买电脑。我们来回顾下一些代表性应用,从中我们得以窥见,在PC生产力革命中,应用的渗透路径。
这些早期应用发端之时,市场尚未达到消费级规模,它们主要围绕生产力场景构建。
比如,最早在办公领域,1980 年,WordPerfect问世,类似于Microsoft Word,在早期主要应用于法律和学术领域。
紧接着在1982年,Lotus公司推出Lotus 1-2-3软件,加载在IBM PC中。Lotus 1-2-3是一款著名的电子表格软件,类似于我们现在使用的Excel。
Lotus 1-2-3问世两年后,Intuit公司推出的Quicken进一步优化了使用体验,拓展了更多应用场景。它改进了原有DOS系统的交互界面和可配置性,针对小型企业的财务管理需求进行深入开发。它切入了细分市场,拓展了场景纵深,错开了与后发者Excel的直接竞争。
在学术研究领域,相较于传统纸质文稿,使用PC协同修改、保存文稿,显著提高了用户的效率。在文件传输、邮件交流和文本编辑等场景中,PC在学术界的渗透率非常高。
1980 年代末,随着CPU算力和GUI处理能力的增强,软件开始对印刷、广告设计等行业产生重大影响,传统的设计流程(手工绘图和排版)开始向数字化转型。1989年,Corel公司发布了CorelDraw软件,这是首个结合矢量图形设计和桌面出版功能的软件。类似于后来的Photoshop,为用户提供了专业的图像处理功能,用于编辑出版,创造营销物料。
这些应用的早期定价相当高昂。例如,Lotus 1-2-3 的定价为495美元。根据世界银行数据,1982年美国人均国民总收入为1.42万美元,平均每月为1183美元,相当于买一款软件,要用掉半个月的收入。可以说,早期的软件主要面向具有强大付费能力的用户。
在生产力场景之外,一些面向娱乐场景的游戏软件逐渐发展。比如,1995年,《微软模拟飞行》这款游戏,让人们能够在家实现当飞行员的梦想,吸引了喜欢探索和尝试的用户。
可以看到,早期的PC生态由重度的生产力工具与一些有趣的游戏应用共同构建而成,从产业和学术研究场景起步,逐渐破圈。然而,这个过程非常漫长,因为底层的DOS和GUI技术发展比较缓慢。
这些早期应用所渗透的商业场景,也与当下的时代脉搏遥相呼应。或者说,当下的AI应用方向,与早期软件行业的发展路径如出一辙。比如,Google发布的NotebookLM让人眼前一亮,这是一款基于AI的笔记管理工具。我们也看到一些创业公司在做法务和财务知识库类的ToB AI应用。此外,AI游戏在这两年快速涌现,包括各种层出不穷的Chatbot、开放世界、游戏Agent、AI NPC等等。
类似地,就像早年应用的爆发受限于底层的DOS和GUI技术的发展进程,当下,虽然OpenAI发布了视频生成模型,但还未迅速应用于实际场景,一个原因是还要等待计算资源和GUI技术的成熟需要时间。因此,充分考虑不同技术发展要素可能出现的时机,显得至关重要。
总结1980年代的应用生态来看,Wordperfect与Lotus的表现可圈可点,Lotus抓住了窗口期,快速发展起来。Wordperfect交出了5年800万用户的成绩单。但是,微软和苹果花了近8年时间打磨操作系统,Windows Office问世,让这些应用的竞争出现了全新的态势。而另外一边,Quicken、CorelDRAW以及游戏类应用则各自在自己的用户群中以更慢的速度,逐渐发展起来。
“Killer App”案例:PC领域的“生态级玩家”——微软
微软是PC领域生态级的玩家,当我们梳理微软这家公司的发展脉络之后,可以发现他的崛起并非只源于产品力,而主要得益于出色的商业策略。
早在起步阶段,微软就展现出了敏锐的商业嗅觉。1980年,微软购买了名为86-DOS的第三方操作系统(是的,买来的)。这一举措使微软成为 IBM的重要合作伙伴。不过,微软迅速与其他硬件厂商展开合作,打破了与IBM的独家合作关系。
从80年代至90年代,微软经历了一些关键的发展节点。
1981年,微软发布MS-DOS 1.0。1983年,微软开始推出文本编辑软件,功能类似当时市场占主导地位的WordPerfect。这种 “以关键应用拉动系统销售” 的策略,一直伴随着微软。
1985年,微软发布Windows 1.0, 抓住了图形用户界面(GUI)增长的机遇。此后,微软一方面通过授权第三方来拓展Windows 1.0的市场,另一方面在1985年 开始向用户直接销售Windows 1.0。
彼时,Lotus公司推出的定价495美元的表格软件,已经占据超过一半的市场份额。所以我们不难理解,前微软CEO史蒂夫·鲍尔默在电视购物平台推广Windows 1.0时,反复强调:“我们的系统提供棋类游戏、电子表格和图像处理功能,只要99美元,不是500或600美元。”
微软需要同时维护DOS和Windows 1.0两套系统,在相当长的一段时间里,几乎无暇顾及应用层的开发。尽管如此,微软仍在持续成长。1989年,微软发布了Microsoft Office,占领了应用层的大量市场份额,为其后续的发展奠定了坚实的基础。
值得注意的是,Windows 1.0的发布比施乐的GUI系统整整晚了四年,这一定程度上反映出操作系统需要经历漫长的研发过程。早期的Windows在最初的两三年里,销量仅为上万台,但在其诞生后的8年内,累计出货量达到了五六百万台,增长曲线极为陡峭。
如果类比到当下,哪些AI应用会成为新的生态级玩家?MicrosoftAzure、OpenAI、iOS将以怎么样的角色,参与到AI时代的操作系统?哪些AI应用能够抓住发展的窗口期?大模型公司又会如何影响应用层的创新机会?对于这些问题,透过历史来,我们应该能够窥探一二。
新的交互方式,让电脑逐渐进入大众消费市场
尽管计算机技术起源于北美,有些欧洲发达国家早早通过海运引入了PC设备。
上文提到,早期PC主要聚焦于生产力场景。直到1989年,图像处理等应用开始涌现,才带动PC切入游戏等新使用场景。即便后来出现了对用户更友好的GUI系统,PC也一直未能大范围进入大众消费市场。PC真正进入普通家庭,是在1994年左右。随着互联网的兴起,以及网景浏览器的诞生,越来越多在公司使用电脑的人,开始在家中购置设备。
PC进入大众消费市场的过程中,一个值得一提的变量是人机交互方式的演变。新的技术要赢得消费级市场实现普及,往往离不开新的前端交互方式或设备。比如,鼠标的引入,构建了全新的人机交互模式,极大地增加了PC 的渗透和互联网技术的普及。比如,触屏这种交互方式在手机和移动互联网的普及过程中起了重要作用。
当下,新的LLM、Agent、多模态等技术走向大众市场可能也需要新的交互入口。由于芯片算力的提升,设备后端的处理能力更加强大,前端进一步往轻量化、便捷化的方向发展。未来的硬件可能会进一步减少对前端的依赖,用户在后端发出一个指令,设备就能自动完成任务。我留意到峰瑞也在关注类似AI/XR眼镜、AI耳机等各种各样的AI可穿戴设备。
在PC时代,技术产品的演进路径是从提高生产力的工具,到在消费级市场迎来爆发性增长。如今,信息传播速度飞快,AI是否能赋能更多的消费级场景,仍需时间验证。在早期阶段,我们可能仍然需要关注能够提高生产力的场景。除了大企业需求之外,全球持续增长的自由职业人群,会是软硬件新品服务的核心群体。
小结:影响早期硬件行业的“四个要素”
回顾了PC行业早期蓬勃发展的十年,我们可以总结出其发展脉络上的四大要素:芯片、系统、应用、终端。
首先是芯片,或者说存储和计算单元的演进。
自1980年代以来,虽然芯片和存储的成本有所下降,但难以显著降低,这与摩尔定律有关。简单来说,当旧制程的芯片成本降低了,人们又需要研发成本更高的先进制程芯片。
今天,人们为了应对海量数据存储的挑战,在云计算之外,部署了边缘计算,将部分数据分析功能放在终端。因此,降低AI推理芯片的成本,与此同时,推进以AI计算为底层逻辑的IDC基础设施,成为重中之重。
其次是操作系统。这个早期不起眼的中间件,其实承担了资源管理、设备适配等关键任务。在技术发展的长河里,我们已经看到了操作系统的长期爆发力,比如我们熟知的Windows、iOS系统。
再次是应用。早期的杀手级应用可以赚钱,但如果不切入到更纵深、垂直的场景中,最终可能被取代。通常应用层是在系统层之上的,那么,应用厂商能下沉到操作系统层吗?历史上,貌似只有Google实现了“半步”,将自己的应用集成到操作系统中销售。今天,什么样的AI应用会被模型公司吃掉,是AI应用创业者和投资人需要深思的问题。
最后,是作为交互载体的终端硬件产品,实现商业化价值。以PC为例,早期,人们购买的是PC这个硬件作为交互载体,但随着操作系统平台的建立,硬件本身的重要性相对降低。平台为王的时代,操作系统不仅创造了用户价值,也孕育了丰富的应用生态。这一现象在移动互联网时代也得到了验证。
1990年以后,一些我们更熟悉的故事
我们简单带过1990年后的故事。1990年代,我们迎来了英特尔奔腾处理器的发布、互联网应用的爆发、Windows 98的诞生、计算机外部设备连接标准USB 1.1,以及笔记本电脑的小型化与轻薄化,也就是我们常说的上网本和超极本。这一系列技术革新,指向了计算机发展脉络的不变趋势 —— 互联网真正走进了千家万户。
在这个时期,CPU进一步轻量化,USB 1.1的问世让外设的扩展更加便捷,鼠标等设备的连接也变得轻而易举。互联网的兴起,使得大规模的消费者开始使用个人计算设备。
值得注意的是,PC的发展揭示了一个明确的趋势:轻量化和便携性。
这里就不得不说到中国深圳的硬件行业发展。2000年初,当时有两拨人:一拨是来自中国台湾的组装厂,早期主要活跃于宁波和深圳;另一拨是在深圳本土组装PC的创业者,这也奠定了深圳作为消费硬件产业集群地的基础。与此同时,就像80年代硅谷的那些极客一样,一批中国极客开始打造、组装自己的电脑,这些人成为了PC的种子用户。
我曾与联想的朋友交流过,在他们市场渗透的初期,已经有了浏览器的存在,留给中国厂商的创新空间已经很少,各大厂商只好做些小的用户体验层的创新,但事实证明,也是非常有效的。联想通过开发简洁的拨号上网应用程序,极大程度降低了消费者联网的学习门槛,帮助他们迅速占领市场。随后,组装机逐渐退场,以联想为代表的品牌机的时代来临。耳熟能详包括:方正,清华同方和神州等品牌。
回顾PC的发展历程,不变的是:设备走向了便携化,越来越轻薄,人们可以随时随地进入数字世界;设备的功能从早期的生产力工具转向众多场景。那么,AI或者说大模型的应用会先在哪些垂直行业落地?AI的能力何时会实现泛化?这与背后的计算能力、设备形态、操作系统的成熟度都密切相关,它们是相互耦合的。
现如今,AI芯片等新变量,例如GPU、TPU 以及RISC-V,又推动了系统的演进,而系统的变化将穿透到应用层面。当时机成熟,端上爆发出许多有趣的AI原生应用,让本地的Copilot变得更加强大。然而,这其中的产业链要素非常多,需要我们深入思考,并观察关键玩家的变化。
什么让新硬件成立?专用设备 vs. 通用计算设备
在梳理PC领域发展的过程中,我意识到了一个非常有趣的问题:如今多种形态的AI硬件,可以与当年的PC发展做类比吗?哪些设备创新被PC吞噬了,哪些却没有?当时的PC如此强势,正如今天的手机、笔记本电脑和云计算。那么,哪些场景出现了专用设备与通用设备的分离,而非被一个大一统的设备通吃?
一定会被提到响亮的名字是,任天堂!1983年,任天堂推出第三世代游戏机,实际上这款游戏机使用的芯片与苹果一代、二代完全相同,但它却成为了一个专用设备。直到今天,索尼公司出品的PS5、微软研发的Xbox依然在硬件领域占领一席之地,也是相同的道理。因此,当垂直场景在计算需求、系统需求、用户需求、交互方式等方面有足够的深度时,就有机会形成独立的专用设备品类。
摩托罗拉于1999年发布的PDA也是如此。虽然它使用相对滞后的低算力硬件,但却满足了个人数字助理的需求。当时的PDA只是一个低成本的信息管理工具,可以记录日程和联系人,价格比PC低很多。PDA在便携设备的发展历程中曾占据了一个独特的小生态位,没有被PC吞并,并且可被视为手机的前身。
二、今天的AI硬件与应用,以及新机遇
回到当下,虽然产业链要素发生了变化,但不变的是人们对数据获取、生产和传播的需求。在抽象层面上,人们的需求从通过GUI操作,转向智能化的代理(Agent)直接完成任务。
有了Copilot,创作者可以输入一些上下文,让机器帮助他们获取创意脚本,或了解同行在做的产品。企业可以通过一个Agent,实时追踪行业相关的所有创新动态,自动生成每周报告。
这些获取、生产数据的方式,将变得更聪明。而这种载体一定与传统PC不同,它可能是一个始终在线、实时运算的计算设备。过去,人们需要通过鼠标和GUI操作来提高生产力;而当人工智能直接被嵌入计算设备时,它可以独立采取行动。这意味着,人机交互方式可以不依托鼠标和显示屏。你可以发送一个任务,人工智能就能直接完成。这些变化会催生新的硬件交互形态。
而这一切将如何实现,我们也能从过去40年的PC发展史里找到一些答案中看到一条脉络。因为,这些底层的场景诉求具有一致性。GPT驱动的新生产力变革,早期大概率会聚焦能提升生产力的场景,犹如Dos时期的Lotus 123。如果我们试着结合之前提到的游戏产业、图像处理产业,以及生产、获取、传播数据的方法,理论上能发现许多新的应用场景。
新的生产要素,如何影响硬件创业?
AI大模型的出现,让四要素发生了变化。在芯片层面,GPU、TPU等芯片让算力不断提升;在系统层面,大模型可能会逐渐与系统融为一体;在终端层面,用户与设备交互产生的私有化数据会更有价值;前三个要素的变化,也会催生出新的应用。我们或许会见证一种全新的存算一体的计算设备的诞生。未来,它的地位可能与手机、笔记本,甚至公有云都有所不同。我试图用一张表来清晰地罗列出它的特点。
从生产力场景起步,不同的速度渗透进入各场景。
-
大模型与新操作系统:大模型是智能化的发动机,它很可能将和操作系统融为一体。如今微软推出的云计算服务平台Azure的增长,Windows的动作以及OpenAI探索AppStore模式,都在表现出不同玩家争夺新系统身位的早期态势。
-
GPU或者ASIC算力:在1980年代,Intel是硬件领域的佼佼者,当下,NVIDIA风头正盛。GPU和大模型的专用计算设备正在变得智能化,我非常看好ASIC芯片(Application Specific Integrated Circuit,一种为专门目的而设计的集成电路,而非通用芯片)和NPU。这些设备如果快速迭代,可能会在2030年之前催生新应用。
-
私有化数据:数据依然是新石油。对于AI而言,独特的组织内部或专有的高质量数据资源,或机器获取的私有化数据,是训练和生成的关键资产。
-
AI应用:从行业发展回顾中,我们可以看到应用不是独立于系统和硬件存在的,而是研发者基于系统和硬件现状,对于场景价值的挖掘与探索。成功的关键在于对系统和硬件载体能力的理解,对用户的理解,以及对时机的把握。
信息技术一直朝着便携的方向前进,这是人们长期的需求,比如,我们的电脑从没法移动的PC变成了随身携带的电子笔记本。然而,设备要想实现便携性,它的计算能力和续航就会受限,进而限制其能够运行的模型智力水平。当前手机能够运行的模型参数通常在3B参数级别。相较之下,私有云能够运行的模型参数在数十B级别,公有云则在百B级别。
这意味着,当Windows或者下一代安卓系统准备就绪时,它们可能会以3B级别的模型和Copilot作为基础,启发新一代的AI应用,例如AI驱动的浏览器、邮件回复Agent、AI办公软件、AI收藏夹、文档检索总结Agent等。这是手机和笔记本必然会经历的阶段,因为从硅基工艺角度来看,每瓦特的AI算力不会快速发生巨大的变化。
另一方面,则是基于公有云的超级人工智能。在过去10年云计算的高速发展中,云已经成为公认最有价值的AI核心基础设施。但云已经暴露出自己的问题:AI时代,每个人和组织,是否愿意将自己所有的数据交给一家AI公司?或者说你是否愿意将淘宝、微信和资金账户的访问权限全部交给单一的厂商?这显然是个巨大的心理成本。一个可能的方向是,云开始在最顶层发挥作用,厂商通过API调用方式来发送任务,在这个过程中,AI通过强大的模型能力,来为厂商提供相应的数据。
在AI应用和公有云这两者之间,出现了构建全新系统和硬件的机会。这种操作系统或许能像一个智能代理,运行在24小时通电的设备上。你可以通过手机或笔记本向它发送任务,它会在后台自动执行。它拥有巨大的数据存储容量,且由于没有算力限制,可以配备百瓦级的GPU,提供约200 TOPS 的AI算力,以确保足够聪明。具体而言,它可能是一台私有云设备,所有数据都在本地,服务于家庭和小型组织的存储与计算需求。
新设备可能最先触达的用户:创作者、工程师与知识工作者
这种新设备会以什么样的形态出现呢?目前讨论得比较多的是AI眼镜、AI耳机,我认为,极有可能出现一种始于生产力,提升进而拓展为消费级的个人计算设备,它甚至是存算一体的。
基于这些判断,我创立了冰鲸科技。2021年,我们的第一款私有云产品开始在海外众筹网站发布,吸引了极客人群的关注。通过访谈和调研,我发现,不只是极客工程师群体,创作者与知识工作者群体,也有大量数据资产的管理需求,需要生产力工具来解决他们在存储和协作方面的痛点。这与早期PC的渗透路径类似,瞄准那些愿意付费、对生产力有强烈需求的用户,切入全新的战场。
再次回到我们在前面讲到的始于硬件,兴于应用,终于生态。对我们来说亦然。硬件是起点,但应用才能带来更大价值。我相信开放的生态,社区化的运营方式,能够帮助我们更早地吸纳涌现出来的各种应用,就像硅谷早期的极客社区那样。
1980年的硅谷vs.今天的中国:AI计算时代,中国的结构性机会
可以预见,未来十年,在信息设备领域,大概率是软硬件混合的结构性创新。这对创业公司的入场门槛有较高的要求。我认为,在这个方向,将有机会诞生出非常独特、有趣的由中国公司引领的创新。无论是AI NAS还是AI PC(人工智能个人计算机),我并不认为硅谷会继续主导这一轮创新。由于产业链能力的弱化,硬件迭代速度在美国呈指数级下滑。
正如硅谷知名投资人彼得·蒂尔所说:我们已经很久不知道如何投资硬件了。这确实是美国的现状,也是中国的窗口期机遇。在当下其实可以毫不夸张地说,全球找不到任何一个地方比中国珠三角更适合硬件产品的孵化。毫无疑问,中国的长产业链所带来的创新效应将会延续。
除了产业链基础,在软硬件混合的领域,还中国还有出色的工程师供给,中国在AI硬件和AI端侧的创新潜力正在形成共识。作为这个方向的从业者,希望能跟更多人一起开启这段摘星之旅。也希望之前提到的操作系统、应用、计算和模型等创新要素,能对大家的投资决策和创业实践有所启发。
三、投资人说
非常感谢潘总深入的洞察和思考。我个人看到目前市场上的AI硬件主要包括以下四种:
正如前文潘总所讲,整体而言,垂直领域的AI硬件创新,需要找到合适的场景做纵深,才能避免被手机、PC等产品形态所吞掉。短期内,手机与PC的生态位是难以撼动的,大模型的使用也正逐渐成为明牌,那么,AI硬件创新最关键的是找到合适的场景,深刻理解用户需求,做出足够深厚的中间层,设计出好的产品并提供极致的体验。从这个角度来看,AI+硬件,很大程度上本质是AI应用,硬件本身则更接近一个容器/载体。
在AI可穿戴设备方向,今年AI PIN在北美一度很火。这款产品提供了接打电话、网络搜索、智能语音助手等功能,但随着产品的交付,问题逐渐显现。其实这个产品形态的挑战很大,因为大多数消费者很难理解一个没有“锚点”的全新产品。所谓“锚点”,是在消费者心中已经有认知的东西。比如一款AI耳机,或者AI自行车,消费者会拿这个新产品和他心目中的锚点产品的平均指标进行对比。
首先,这个新产品不能低于行业标准水平的90%,然后才会关注附加的创新功能。而AI PIN是一个没有锚点的产品形态,消费者比较难接受。
今年我们看了大量的AI可穿戴产品,其中以AI眼镜、AI耳机为主。我发现一些创业者把眼镜的功能堆得特别丰富,但是忽略了眼镜本身最核心的指标之一是舒适性和时尚性。一般来说,无框或细框的普通光学眼镜,重量大约在 15 克到 30 克之间,但现在的AI眼镜往往较重,想象一下一个人每天长时间戴着60g以上重量的眼镜,那肯定非常难受。
要把AI眼镜做得足够轻便,同时能承载一些新功能,这就对产品的整体结构提出了非常高的要求,而且要在续航、摄像头、显示这三者之间做权衡取舍,当然这取决于你想以什么样的多模态进行交互,这背后需要综合考虑产品的重量、材料(舒适度)、时尚性(可插拔模块化)、近视匹配方案、续航、手机互联等多个方面。
具体到AI功能层面,首先“唤醒”是一个在用户体验层面非常重要,但非常难解决的点。在目前的软硬件技术条件下,要在ToC的产品上实现无感的唤醒(不说唤醒词、不按实体按键)并且自动工作,是非常难的。这意味着你的Agent要持续识别环境要素,同时要有效理解你的意图,并实时判断它需要调取什么样的任务处理功能。
唤醒的下一层,则是具体的AI任务功能层面。单纯加一个大模型的端口,然后把所有任务直接丢给大模型,并不能有效解决问题。关键可能在于找到合适的场景,深耕这个场景所需要的AI能力,然后打造出好的产品。如果选择办公场景,那可能要先把翻译、转写这些基础功能做好,如果你关注的是户外运动场景,那么运动指标分析、智能导航、拍摄记录等功能或许更重要。此外,针对旅行博主的AI产品和针对视听障碍人士的AI产品,在生成内容的形态上一定差异巨大。当然,以上功能的最终收口是成本。
除了AI可穿戴产品,今年我看的比较多的是AI陪伴类产品,可进一步细分为成人情感陪伴和儿童陪学陪玩。对于做成人情感陪伴AI硬件,最挑战的是,在Character.ai类软件陪伴产品已经开始赢得市场的情况下,找到独立硬件存在的合理性和必要性。也就是需要回答,到底某个场景下,硬件能带来升级的感官体验。
儿童AI陪学陪玩是一个非常有潜力,但是非常难做的市场。第一,由于一些家长会限制儿童看电子屏幕的时长,天然就造就了独立硬件的机会。第二,中国双职工家庭占比非常高,父母陪伴孩子的时间有限,面向儿童的高质量的陪伴,以及寓教于乐的教育辅助也是确定性的刚需。
然而,挑战也是非常明确的。比如,儿童注意力较为分散,即使面对再好玩的东西,大多数儿童的注意力也很难持续超过半小时。再比如,儿童的语言组织与表达与成年人不同,一旦大模型没有充分理解儿童的意思,开始“打岔”,儿童会迅速失去耐心。此外,陪学的功能听起来fancy,但是,一旦儿童发现这不是玩具,是用来学习的,可能会有一定的排斥心理。总之,一款硬件产品很难满足儿童长期的需求。
此外,在这种情况下,提供高质量的内容非常重要,包括引入儿童喜爱的IP和剧情,把故事、游戏等元素有效的结合或许是个思路。此外,针对模型的训练也很重要,要能够让模型更有效地理解儿童的意思,才能进一步有效交互。当然,安全因素也是儿童类产品需要重点考虑的。
从更长期的角度来看,如果未来所有儿童玩具都有对话和运动能力,下一步拼什么?比如,近几年非常知名的AI玩偶LOVOT提供了一个思路。最初其核心差异化特色是动作表情交互,随着技术的发展,当其他产品也能做动作表情,LOVOT开始从卖功能转向卖IP。
此外,第四类AI硬件产品是具备一定泛化能力的家庭机器人,目前在这个方向上的突破不多,更多是集中在识别能力的以及针对corner case的处理上。短期来看,这类产品受制于成本价格,没有办法使用算力较高的芯片;长期来看,具身智能的实现还有很长的路要走。欢迎感兴趣的朋友,阅读《具身智能 vs. 运动科技:一个让机器像人,一个把人变成机器?| 峰瑞报告》。
以上是我对AI硬件的一些思考。