作者:范维光
近期,依图、云从、云知声等人工智能领域的初创头部企业均发布了在科创板上市的招股说明书,上市是一个公司的成年礼,标志着公司商业模式的成形和具有了独立发展的能力,而招股说明书是公司向市场提交的第一份答卷,第一次在公众面前完全打开自己,接受市场审视,并向市场传递公司定位、使命和愿景的信息,市场根据招股说明书披露的信息对公司估值。招股说明书动辄数百页,但公司希望向市场传递的信息却可以用几个关键词来概括,本文总结了几家人工智能初创企业的关键词,希望从它们的生态定位和未来发展战略中观察AI行业趋势。
依图的关键词
芯片
依图的第一个关键词是芯片。招股说明书中开宗明义芯片是其核心,比如“第八节业务与技术”的第一句话:“依图科技是一家世界领先的人工智能公司,以人工智能芯片技术和算法技术为核心,研发及销售包含人工智能算力硬件和软件在内的人工智能解决方案。”看到了吗,已经把芯片技术放到算法技术前面了。芯片目前主要用于依图自己的产品,并未对外销售。
在大家印象里,依图是一家算法公司,这么强调芯片,为什么?
中国政府和社会各界对自主掌握关键芯片的迫切愿望当然是一个重要原因。更重要的原因,恐怕在于芯片行业的规律:每一个大的科技浪潮来临时,旧时代的霸主都会被甩下车,权力转移。这样的戏码,在过去十年里已经上演了两次。第一次是iPhone开创的移动互联网时代到来,凭借多年移动通信市场的积累以及ARM架构功耗远低于X86架构功耗的特点,高通成为移动通信SoC芯片一哥,PC时代霸主英特尔只能无奈固守PC和服务器市场,高通在2012年底市值超过英特尔,并维持数年;最新的一次则是人工智能时代来临,多年偏居一隅为显卡厂商提供GPU芯片的英伟达异军突起,凭借GPU适合大规模并行计算以及可以将这种能力发挥到极致的CUDA(Compute Unified DeviceArchitecture)平台,英伟达迅速占领人工智能市场,在写下这段文字时(2020年12月20日),英伟达市值3286亿美元,超过英特尔1944亿美元的市值和高通1667亿美元的市值,虽然英伟达2020财年(2019年2月1日-2020年1月31日)的营收109亿美元仅为英特尔2019财年(2019年1月1日-2019年12月31日)的净利润210亿美元的一半多,但资本市场看的从来都是预期。
依图应该是看到了这里面的巨大机会,才会如此强调芯片。报告期内,依图在人工智能芯片及云边端算力硬件产品的研发项目上已投入3.4亿元。依图IPO计划募集资金75亿元,募集资金使用中与芯片相关的有:1)新一代人工智能IP及高性能SoC芯片项目,投资总额23.2亿,占募集资金总额的30.89%;2)基于视觉推理的边缘计算系统项目,投资总额8.1亿,占募集资金总额的10.81%;3)新一代人工智能计算系统项目,投资总额10.7亿,占募集资金总额的14.27%。超过募集资金的一半都投向与芯片相关的项目,这是依图所最输不起而一定要成功的领域,否则其在二级市场的估值将大打折扣。希望他们能成功!
全栈AI技术
我们知道AI四小龙最初的标签都是计算机视觉技术,但是依图已经在语音技术和自然语言理解技术方面大举投入。
在技术先进性方面,依图自创立以来持续投入人工智能领域的基础科学研究,致力于解决机器看、听、理解等根本性问题,积累了大量的人工智能技术研究成果,始终处于人工智能的技术前沿。计算机视觉技术方面,依图曾连续三年在代表工业界最高水平的美国国家标准技术局组织的人脸识别测试中获得冠军;2020年,在由全球多媒体领域顶级学会ACM国际多媒体会议(ACM MM)主办的“大规模复杂场景人体视频解析”挑战赛中,依图获得了“行为识别”的单项第一名,其算法指标将以往学术界的基准算法提升了近3倍。语音识别技术方面,2018年底,依图在全球最大开源中文数据库的错词率测试上刷新纪录;2019年,声纹识别技术也在全球说话人识别挑战赛(VoxSRC)中刷新纪录。自然语言理解技术方面,2019年2月,依图以共同第一作者的身份在世界顶级医学期刊Nature Medicine发表基于中文文本病历做临床智能诊断的研究成果(影响因子32.621),这是目前自然语言理解技术分析中文文本病历所发表的最高分文章。
在落地方面,依图仍以计算机视觉技术为主,语音技术主要落地在归类于智能商业系列解决方案的内容审核解决方案,用于互联网直播平台内容审核等场景;自然语言理解技术主要落地在归类于智能公共服务系列解决方案的智能医疗大数据解决方案,用于实现医疗原始数据到医疗科研数据的自动转化,提高医疗科研效率。
报告期内,依图在基于人工智能算力的城市视觉中枢平台研发项目上已投入6亿元,在语音语义产品及解决方案研发项目上已投入0.8亿元。在募集资金使用方面,与AI算法技术相关的有:1)高阶视觉智能计算平台项目,投资总额6.9亿元,占募集资金总额的9.19%;2)新一代语音语义能力平台项目,投资总额3.8亿元,占募集资金总额的5.02%。募集资金中主要投向就是芯片和AI算法技术,二者合计占了70%,剩余30%用于补充流动资金。
医疗
根据应用场景的不同,依图的主要业务分为智能公共服务和智能商业两大类。智能公共服务业务覆盖城市管理、医疗健康两个场景,终端客户包括政府部门、医疗机构及大型企业等;智能商业业务覆盖园区管理、网点服务、安全生产、交通出行和互联网服务等场景,终端客户包括商业地产、金融业、制造业、交通运输、互联网等领域的企业客户。公司主营业务收入结构如下表所示。

在医疗健康场景,以计算机视觉、自然语言理解等人工智能算法技术,对海量多源异构的影像数据、医疗文本数据、基因数据等医疗数据进行解析及分析,依图研发出care.aiTM系列解决方案,赋能医院、体检中心、政府机构、医疗公司等医疗行业参与方,助力医疗科研效率、诊疗能力以及服务水平的提升。care.aiTM系列解决方案包括智能医疗临床决策解决方案、智能医疗大数据解决方案及智能医疗管理解决方案。
智能医疗临床决策解决方案是以计算机视觉技术对医疗影像数据进行挖掘分析,并进行辅助诊断的解决方案,目前覆盖肺癌、乳腺癌、儿童生长发育、脑卒中、病理、新冠肺炎等病种。具体相关产品为胸部CT智能4D影像平台、乳腺X线智能诊断系统、儿童生长发育智能一站式解决方案等。其中,胸部CT智能4D影像平台在2018 年率先实现了以部位为中心、多学科综合诊治的智能影像辅助诊疗系统,为临床医生的影像学诊疗提供了重要支持,大幅度减轻医生工作量。
依图通过知识图谱、文本结构化等人工智能技术对复杂医疗文本数据、语音数据、影像数据进行智能识别、统计、分析,形成智能医疗大数据解决方案,包括临床 NGS分析解读系统、智能单病种数据库及多组学智能科研平台,实现医疗原始数据到医疗科研数据的自动转化,助力医疗科研领域提高工作效率。
贯穿诊疗全流程的智能医疗管理解决方案在诊前提供智能导诊、诊前检验、预问诊功能,在诊中提供病历自动采集功能,在诊后提供智能随访管理功能,全面提升诊疗效率。2019年依图同上海儿童医学中心合作,通过该解决方案,利用患儿就诊过程中的碎片化时间将部分诊前工作提前,使等待及排队时间压缩至1小时内,该项目入选上海市第二批人工智能试点应用项目。
依图未将智能公共服务业务收入结构打开,所以无从得知其智能医疗业务收入和利润情况。报告期内,依图在针对医疗影像的智能医疗临床决策平台研发项目上已投入1.2亿元,在智能医疗大数据平台研发项目上已投入0.5亿元,在智能医疗管理平台研发项目上已投入0.4亿元,总计2个多亿,与投入芯片的3.4亿和城市视觉中枢平台的6亿相比仍属小头,且募集资金投向中未有明确投向医疗的项目。据此,可以大胆推测,医疗并非依图业务重点,最重要的仍然是芯片。
云从的关键词
人机协同操作系统
云从主要产品和服务可以划分为人机协同操作系统和人工智能解决方案。
根据招股说明书的描述,云从一方面凭借着自主研发的人工智能核心技术打造了人机协同操作系统,通过对业务数据、硬件设备和软件应用的全面连接,把握人工智能生态的核心入口,为客户提供信息化、数字化和智能化的人工智能服务;另一方面,公司基于人机协同操作系统,赋能智慧金融、智慧治理、智慧出行、智慧商业等应用场景,为更广泛的客户群体提供以人工智能技术为核心的行业解决方案。云从的收入结构如下表所示。

云从人机协同操作系统是指通过对云-边-端一体的设备、AI 应用和资源的统一管理,实现从设备接入、感知、存储、计算、理解到决策的操作系统底层平台。云从人机协同操作系统的技术架构如下图所示。

云从基于人机协同操作系统,根据不同应用场景的客户需求提供人机协同操作系统及其应用软件,服务于客户单点业务效能提升或整体业务场景智能化升级,云从向客户提供的人机协同操作系统应用产品总计有16种,主要为各种人脸识别软件/SDK/引擎、人脸大数据平台、OCR识别软件、人证核验软件等软件产品。云从向客户提供基于人机协同操作系统的应用产品,由云从根据合同约定向客户交付相关应用产品、SDK或整体操作系统。部分项目根据客户要求需进行定制化开发,由前台业务线按需定制开发人机协同操作系统应用产品,根据验收节点向客户进行交付,客户根据工作量或开发进度分期结算。该业务以软件为主,毛利率较高,2017年、2018年、2019年和2020年1-6月的毛利率分别为81.35%、75.55%、89.3%和73.78%。
人工智能解决方案
云从基于人机协同操作系统及其应用产品和AIoT硬件设备面向智慧金融、智慧治理、智慧出行和智慧商业提供综合解决方案,AIoT主要是各种人脸识别终端/门禁/闸机、刷脸支付终端、客流分析终端等,共计20种。云从人机协同操作系统和人工智能解决方案的整体架构如下图所示。

云从的人工智能解决方案业务主要为客户提供针对具体应用场景定制的行业解决方案,解决方案包括自主研发的人机协同操作系统和智能AIoT设备以及第三方软硬件产品,并提供相关技术服务。通常由前台业务线成立专门的项目小组,根据合同约定为客户按需制定人工智能解决方案并开展交付实施等工作。其中,云从重点负责整体解决方案制定、人机协同操作系统定制化部署和智能AIoT设备设计,自主研发的智能AIoT设备采用ODM或OEM方式生产。
该业务包含硬件,且会集成第三方软硬件产品,虽然营收占比很高,但毛利率较低,2017年、2018年、2019年和2020年1-6月的毛利率分别为18.77%、17.76%、23.43%和34.61%。相比之下,依图毛利率高于云从,依图2017年度、2018年度、2019年度及2020年1-6月的智能公共服务业务毛利率分别为49.64%、52.03%、63.78%及63.65%,智能商业业务毛利率分别为70.19%、64.57%、64.81%及 81.32%。
开放的AI生态系统
对于未来发展战略,除了致力于成为高效人机协同操作系统的建设者和行业解决方案定义者之外,云从还表示要致力于成为人机协同生态体系的领导者,将秉持开放的人机协同发展理念,与软件开发商、硬件开发商、渠道供应商等生态伙伴积极合作,向生态开放人机协同操作系统的AI能力,提供AI能力接入与技术支持服务,通过生态合作方式覆盖更广泛的客户群体,将人工智能以人机协同方式嵌入全业务流程,达成领先的人类与机器智能的交互体验,实现用户体验的跨越式提升。通过以人机协同操作系统为基础的生态体系建设,巩固自身行业领导地位,实现公司业务持续健康发展。
承载开放生态系统的是轻舟系统生态建设项目,通过私有化系统基础能力研发、私有化系统运维管理套件研发、应用商店研发、部署开设工具研发、智能自持模组研发、授权计费模组研发、安全防护模组研发、生态服务中心研发、原生生态内容研发和开放生态社区研发等方向的研发,突破和改进现有产品的技术能力,面向人机协同技术前沿领域开展能力建设研究工作,最终形成核心技术和平台化,面向以智慧金融、智慧治理、智慧出行和智慧商业等纵深核心高端行业商业化落地应用,实现云从科技服务平台化和多元化发展目标。
轻舟系统生态建设项目是首个“开源”的人机协同操作系统,100%国产“自主可控”和“积木式”的全栈能力平台。人机协同平台服务不仅是数据中台,也是一个AIoT物联和AI能力中台,同时也是业务应用和SaaS服务中台。人机协同平台服务利用云从科技人机协同操作系统全面的视觉、语音、文字等智能感知认知能力和用户画像、知识图谱等数据融合解析分析能力,赋能构建内外一体协同的共创生态。无论是生态软硬件合作伙伴,还是各行业业务合作伙伴,都可以在数据、算法、能力引擎、标准应用集等四个层面,基于人机协同平台进行自由组合,完成对应的方案合作开发与生态搭建,并形成具有场景落地价值的云、边、端一体协同的解决方案以及SaaS服务。
云从本次发行计划募集资金37.5亿元,其中人机协同操作系统升级项目投入金额为8.1亿元,轻舟系统生态建设项目投入金额8.3亿元,人工智能解决方案综合服务生态项目投入金额14.1亿元,剩余6.9亿元补充流动资金。
云知声的关键词
两大中台
根据招股说明书,云知声的核心能力主要包括依托其基础架构建立的技术中台,以及在技术中台基础上,按照模块化思路整合而成的产品中台。
基于完备的人工智能基础架构,云知声构建了以智能语音为中心,覆盖从声音“感知”(语音信号拾取与重建)、“认知”(对语音所含信息的综合理解)到“生成”(类人自然语音表达),共三个维度的核心技术,实现了对人工智能语音相关核心技术的全覆盖。此外,结合场景端的具体需求,云知声在人工智能语音技术之外,也持续拓展其在图像识别、人工智能芯片核心IP、特定领域知识图谱构建等方面的能力。云知声技术中台架构如下图所示。

鉴于人工智能语音技术应用需求的复杂性和多样性,云知声围绕“云-端-芯”对其核心技术进行了模块化梳理和整合,形成了产品中台,从而使其具备面向市场需求的快速产品化能力。
芯:人工智能技术具有运算密集的特点,物联网边缘侧芯片在提供充足算力的同时,必须考虑功耗、成本、可靠性等各项因素的平衡。云知声“芯”的能力即其芯片解决方案,包括基于通用芯片的解决方案和基于AI专用芯片的解决方案。前者指基于通用芯片部署人工智能算法引擎和应用,使其更加适合人工智能应用、具有人工智能运算能力的方案;后者指设计开发专门用于终端设备上处理声音或图像的专用芯片,搭载云知声自主研发的神经网络加速器和场景识别智能IP,重组芯片体系架构,从而以更低成本、更低功耗提供算力。
端:人工智能语音技术最普遍的应用场景是实现家电、车辆、机器等各类终端设备的语音交互功能,为实现该功能,终端设备的芯片上必须配置一套软件,该软件不仅可以快速对拾取到的声音信号进行降噪处理,对用户的关键词做出不依赖于网络的实时反应,还要与云端人工智能服务紧密结合。云知声“端”的能力即为这套软件,旨在解决智能语音技术在设备端落地的具体问题,它运行在边缘侧芯片上,除搭载语音识别、语音合成、语义理解等基础引擎外,也一并解决了拾音、降噪、功耗控制、设备硬件适配等相关场景下的业务功能绑定的一系列具体问题,从而使其成为相对标准化的“交钥匙”解决方案,具备快速适配不同类型终端硬件设备的能力。
云:除赋予终端设备语音交互的基础功能外,智能语音技术还需要处理更为复杂的语音和语言问题,并最终通过提供相应服务来满足多样化的用户需求。受终端计算能力的限制,复杂问题的解决通常需要借助云端高性能服务器完成,而用户需要的服务(比如信息查询、设备控制、服务获取等)也通常依赖云端完成。据此,云知声搭建了云平台,一方面搭载了各项核心技术引擎用于解析用户的需求,另一方面持续引入各项能力和服务资源以满足用户需求,最终以云端认知引擎为核心,实现用户需求和云端服务的对接。此套云服务既可以公有云的形式存在,也可以根据客户的特定需求进行私有化部署。
三大系列产品矩阵
云知声依托产品中台,形成了三大系列、数十个产品类型的相辅相成、高度融合的产品矩阵,三大系列分别是智能语音交互产品、智慧物联解决方案和人工智能技术服务。
智能语音交互产品
智能语音交互产品包括以软硬一体形式为主进行交付的物联网语音交互产品,和以软件形式为主交付的智能语音工具产品。
物联网语音交互产品是端云一体化、软硬一体化、技术服务一体化的综合语音交互产品,旨在赋能不同场景下以语音为核心交互方式的物联网终端设备,其硬件形态包括家电语音芯片/模组、车载降噪/语音模组、儿童玩具语音芯片/模组、儿童陪伴机器人语音模组、儿童陪伴机器人整机、智能音箱整机等。为降低终端硬件成本和扩大可适配物联网设备规模,云知声先后研发了面向家居场景的“雨燕”芯片和“蜂鸟”系列芯片,以及车规级“雪豹”芯片。“雨燕”和“蜂鸟”系列均已量产,既直接对外销售,也用于公司部分模组和整机类产品;“雪豹”已进入产品稳定性测试以及车规测试阶段。
智能语音工具产品以充分挖掘语音在信息处理方面的优势、进而提升特定场景的工作效率为设计初衷,帮助企业提升服务质量、提高生产力、降低人力成本。目前主要产品包括用于医疗领域的病历语音录入系统和病历质控系统,用于教育领域的口语评测系统,以及智能语音会议系统、智能语音客服系统等。
智能语音交互产品的收入构成如下表所示。

智慧物联解决方案
智慧物联解决方案旨在通过对特定场景进行智能化的升级,让环境更受“控制”、让环境能听“人话”,目前包括智慧酒店、智慧社区和智慧医院的解决方案。
智慧酒店解决方案基于统一的物联网架构,以智能语音和控制为核心,通过酒店智能管理中台融合入住及退房管理、智能梯控、客房控制、客房服务等智能化子系统/模块,为酒店智能化提供一体化融合方案,以智慧方式连接用户、空间、设备、服务。智慧酒店整体解决方案示意图如下所示。

智慧社区解决方案基于人工智能、物联网等技术,依托智能摄像头、视频监控、人脸识别闸机等各类门禁、车道识别道闸、物联网传感器等前端设备,通过智慧社区管理平台,实现对社区车辆、人员和环境的全面监测和精准管理,打造安全、智能、高效的社区。此外,智慧社区还提供智能家居解决方案,类似于智慧酒店的客房控制,通过管理中台,实现对家电、小型智能硬件的控制。智慧社区解决方案示意图如下所示。

智慧医院解决方案利用语音识别、语音合成、自然语言理解和临床知识图谱等技术,在诊前、诊中和诊后全流程提供医院智能化升级服务。在诊前环节,主要在门诊大厅提供云知声自研核心模块的导医机器人、体检自助机、智能候诊解决方案;在诊中环节,在诊室、科室、病房等不同场景,根据客户需求外购部分应用软件或医疗设备硬件,并将有关软硬件有机地结合在一起,为客户提供定制化智能系统解决方案或智能语音医疗设备,包括入院宣教机器人、医疗设备智能采集服务、远程会诊系统等;在诊后环节,提供个人健康助理机器人、智能随访解决方案等。智慧医院解决方案示意图如下所示。

智慧物联解决方案的收入构成如下表所示。

人工智能技术服务
云知声在销售智能语音交互产品、智慧物联解决方案之外,亦面向优质龙头客户提供人工智能技术服务。一方面,作为典型的人工智能企业,云知声搭建了集算力、算法和数据为一体的人工智能底层架构,在满足自身技术研发、产品开发和运营的基础上,可对外输出相关能力,赋能下游客户的智能化升级,例如可提供语音识别、语音合成、本地唤醒、降噪、多麦克风阵列等智能语音技术支持,助力客户完成语音产品的开发;另一方面,人工智能技术的商业化应用尚属早期阶段,云知声具有丰富的人工智能产业落地经验,能够为优质客户提供特定场景下的人工智能综合性定制化解决方案,例如可为客户提供定制化的智能客服系统解决方案,帮助客户提高效率和服务水平。
目前,云知声已经为平安科技、平安好医生、360、京东、平安人寿等客户提供超算平台、深度学习算法、人工智能引擎、综合定制服务等技术服务。2017年、2018年、2019年和2020年1-6月,人工智能技术服务营收分别为188万元、2405万元、3165万元和386万元,分别占云知声主营业务收入的3.07%、12.24%、14.47%和4.56%。
直面巨头竞争
物联网语音交互产品是云知声重要业务,但这个领域直接面临巨头的竞争。
2019年相比2018年,物联网语音交互产品收入规模有所下降,主要是因为百度、小米等为抢占家庭流量入口,加大了在智能音箱、儿童陪伴机器人等消费级智能硬件的投入,通过价格战、补贴等形式抢占市场,导致云知声所面向的规模较小的下游客户被迫大幅降价或退出市场,因此云知声语音模组量价齐降,出货量下降17.21%,单价下降33.58%。
2020年1-6月相比2019年,物联网语音交互产品收入规模继续大幅下降,主要由于:一方面,受疫情影响,下游家电客户自身产品销售受到较大程度的负面影响,去库存压力增大,大幅消减了购买家电类智能语音模组的数量;另一方面,考虑到智能音箱、儿童陪伴机器人等消费级智能硬件的竞争已趋白热化,智能语音模组的利润空间已经被压到非常低的水平,为避免与其他厂商同质化竞争,云知声开始大力推广基于自研“雨燕”和“蜂鸟”芯片的语音模组方案,在竞争相对不太激烈的白电市场,特别是小家电市场,寻找新的增长点。智能语音模组上半年仅出货23.92万片,销量同比下降86.23%,但随着云知声自研芯片在多家小家电厂商通过稳定性测试并逐步量产,销售局面逐渐打开,前三季度自研芯片出货量已达92.44万片。
结束语
从发布招股说明书的这几家人工智能企业来看,目前AI主要还是做的B端生意,项目周期长,而且有许多定制化,单个项目金额不大,比如云从人工智能解决方案业务2017年做了128个项目,单个项目金额36万元,2019年做了1740个项目,单个项目金额34万元。受限于管理能力,其增速必然会随着规模的扩大而降低,实际上,这三家企业在2019年的营收增速已经大幅低于2018年的营收增速。为了维持高速增长,一方面可以做大项目、大集成,比如云从2017年仅1个合同金额超过1000万元的项目,2019年增至14个;另一方面,可以尽量提供标准化而且需求量足够大的产品,在人工智能产业链中,芯片是最标准化的,需求量也是最大的,所以依图和云知声都选择了自研芯片。

