获取经过验证的数据和专家知识库对于赢得人工智能竞赛至关重要。
人工智能的开发只是全球科技竞争中的一个环节。未来几年,随着在人工智能上的投资预计会超过1.8万亿美元,如何把人工智能技术融入到商业应用中,并通过这种方式赚钱,将决定哪些公司能在这个竞赛中胜出。为了做到这一点,企业需要建立一个非常深入的数据库,里面包含专家级别的数据,这些数据比从网上随便抓取的大量原始数据要有价值得多。这些数据将用来支持新一代的生成式人工智能(GenAI)系统。
但是,如果这些系统只是从未经验证的海量数据中学习,它们就无法区分哪些数据是有用的,哪些是无用的。这就像是你从一堆垃圾中挑不出有价值的东西一样。因此,这些系统可能不适合用来支持那些需要高度准确性的自主应用,比如那些能够增强人类能力、改变现代企业运作方式的应用。
面对这一挑战,一些人工智能开发者开始尝试使用人工智能生成的合成数据。虽然这是一种创新的方法,但其中也存在风险——如果合成数据中有任何不准确之处,都可能对整个人工智能系统造成影响。同时,也有开发者转向通过内容许可协议获取专有训练数据。例如,OpenAI在5月22日与新闻集团达成了一项重要协议,利用新闻集团的《华尔街日报》、《巴伦周刊》和《市场观察》等主要出版物的当前和存档内容,来提升其产品的性能。

获取领域内专业知识
记住,生成式人工智能(GenAI)只是 AI “军备竞争”中的一小部分。许多企业目前正在研发的新一代系统将融合多种人工智能技术,具有多样化功能,能够满足各种细化的业务需求。在此基础上,然后,可以在平台之上叠加大规模的商业应用,为C端用户和B端企业创造价值,从而开辟更广泛的商业化途径。这些技术对于打造能够应对复杂运营挑战的高级人工智能系统至关重要。
我们可能会看到,主要的人工智能开发者将通过收购小型科技公司来获取竞争优势,以确保他们在训练未来人工智能引擎时拥有深厚的行业领域数据基础。

比如,想象一下,未来的Gemini和ChatGPT模型就像美国海军的杰拉尔德·R·福特号航空母舰一样,这是世界上最大、最先进的战舰,它重达10万吨,耗资130亿美元,历时12年才建成。这些人工智能模型的构建和推进需要巨大的资源和投入。但是,通过收购,谷歌和OpenAI可以获得更灵活的“舰队”,包括行业领先的智能应用,它们利用基础GenAI平台的规模和深度,来推动商业价值。利用这些外部的灵活性资源,将是赢得人工智能竞赛的关键。

打破常规的合作伙伴关系
学术界可能成为科技巨头们寻求基础性知识的重要来源。比如,普林斯顿大学图书馆藏书就超过了700万册。设想一下,如果Meta或者亚马逊能与所有的八所常春藤盟校达成合作,将这些图书馆里的实体书籍都转换成数字版本。拥有这些专有信息的独家权利后,他们就能建立专业的数据集,用来训练人工智能系统,以应对工业制造和航空航天等复杂行业的挑战。如果这种学术合作模式在整个高等教育界推广开来,将能创造出庞大的新知识库,帮助他们迎头赶上谷歌和OpenAI这两个在人工智能竞赛中的领头羊。

此外,这种合作还能为高等教育机构带来新的商业机会,有助于缓解美国大学的经济压力。自2010年以来,四年制私立营利性学院的新生入学率下降了超过55%。目前,美国学生贷款的总债务额超过了1.7万亿美元,联邦学生贷款的利率达到了6.53%,这是自2012年以来的最高水平。通过开辟这样一个庞大的新收入来源,学校可以降低学费,吸引更多学生,减少学生贷款的使用,并让更多人享受到优质的教育。这对学校和学生来说,都是一个双赢的局面。

