大数跨境

Sora横空出世,人工智能对未来的影响有哪些?

Sora横空出世,人工智能对未来的影响有哪些? 领导者管理笔记
2024-02-19
3
导读:有人预测:一大批相关的从业人员要失业了......

(微信:New-leaders)进领导者读者群

为避免错过好文,请朋友们将本公众号加“星标★”吧。第一步:点击上方蓝字”,第二步:点击右上角“……”,第三步:设为星标★。



Sora横空出世,人工智能对未来的影响有哪些?


2024年2月16日,Sora横空出世,一夜之间刷屏。


作为OpenAI发布的首个AI文生视频模型,Sora带给人们的感受是非常震撼的。它可以根据输入的文字提示直接生成效果逼真的视频,时长可以达到60s,并且是一镜到底的那种。


这也意味着,继文本、图像之后,OpenAI将其先进的AI技术拓展到了视频领域。


虽然Sora模型尚未面向公众开放,但是已经有人感叹:视频生产颠覆性革命来了……


也有人预测:一大批相关的从业人员要失业了......


然而,事情真的这么简单吗?Sora能做什么,它的局限性在哪里?突飞猛进的人工智能技术,对未来会产生哪些影响?我们又该如何自处?




01


Sora能做什么?



OpenAI在官网陆续公布了几十段长短不一的视频,均根据文字提示生成。


其中一段视频文字的描述为:


一位时尚女性走在充满温暖霓虹灯和动画城市标牌的东京街道上。她穿着黑色皮夹克、红色长裙和黑色靴子,拎着黑色钱包。她戴着太阳镜,涂着红色口红。她走路自信又随意。街道潮湿且反光,在彩色灯光的照射下形成镜面效果。许多行人走来走去。


然后,Sora根据提示生成的一分钟视频如下:


这一分钟的视频在网上广为流传,刷屏朋友圈。视频中从主要人物到背景人物的运动,以及整体的街景,看起来都十分逼真。包括后面女主人公的特写,皮肤的纹理清晰可见,一切都显得十分真实。



那么,这些看上去如此真实的视频,Sora是如何做到的?


据OpenAI官方介绍,用户可以通过使用自然语言提示词

(Prompt),生成长达1分钟的视频。Sora模型对语言有深刻的理解,因而能够准确地理解提示词,并生成令人信服的人和物,而且可以在一个生成的视频中创建多个镜头,在这些镜头中准确地保持角色和视觉风格的一致性。


德国柏林马普所人类发展研究中心的主任格尔德·吉仁泽,在他的一本书《失控与自控》(《How to stay smart in a smart world》)中提到了一个很有意思的概念,叫作稳定世界原则当“环境”稳定的时候,人工智能是可以超越人类的。

比如国际象棋和围棋,都是在有着稳定且明确规则的情况下,人工智能战胜了人类。因此,如果未来和过去一样,那么人工智能所分析的海量数据将有大用处。


因此,复杂算法在有大量可用数据,而且数据明确稳定的情况下运作最好。Sora所呈现的效果也验证了这一点。



02


Sora的局限性


当然,Sora也并非完美。


它不能准确地模拟许多基本互动的物理特性,比如玻璃破碎、吃东西。当一个人咬了一口饼干后,饼干可能没有咬痕,它并不能百分百的准确生成物体状态的变化。


比如在一个样片中,提示词为“考古学家在沙漠中发现了一把普通的塑料椅子,正小心翼翼地挖掘和除尘”,Sora生成的视频出现了椅子在自动行走的诡异场景。



格尔德·吉仁泽在《失控与自控》中提到:“对于从事人工智能开发的人来说,常识是一个巨大的挑战。即使是对于由文字和图片代表的社会和物理世界中的物体的基本理解也是如此。我们还没有通过规则或通过创建能够学习常识的深度神经网络将常识编入计算机程序中。”



常识是在生物大脑中实现的关于人类世界和物理世界的共享知识。常识需要一定的经验。它源于遗传倾向以及个人和社会学习(例如知道世界是三维的,或者一个人不应该伤害他人的感情)。


常识可以通过直觉或深思熟虑的判断来实现。例如,大多数人可以准确分辨出真诚的微笑和仅仅出于礼貌的微笑,但无法解释是怎么做到的。这就是直觉。


然而,当一个人了解到,在真诚的微笑中,嘴和眉毛周围的肌肉都会活动,而在礼貌的微笑中,只有嘴巴周围的肌肉会活动时,这种洞察力就可以使大脑做出有意识的判断。直觉和判断不是相反的两极,而是基于相同的过程,即相同的视觉线索。

OpenAI在官网也表示,目前Sora模型存在弱点:它可能难以准确模拟复杂场景的物理特性,并且可能无法理解因果关系的具体实例。同时,该模型还可能混淆提示的空间细节,例如,左右混淆,并且可能难以精确描述随时间推移发生的事件,例如遵循特定的相机轨迹。


如其所言,对于从事人工智能开发的人来说,常识是一个巨大的挑战。




03


人工智能时代,我们如何自处?



对于Sora的面世,工信部信息通信经济专家委员会委员、数字经济专家刘兴亮称,这标志着AI技术在内容创作领域的一个新纪元。


但也带来了更多的挑战,对于Sora所生成的视频效果,“又有一批人要失业”的说法被反复提起。从Sora展现出的能力来看,技术的进步会让更多的普通人得以进行文本和视频内容两方面的产出,未来也许更加关键的在于审美的积累和核心内容的创作。


此外,随着AI生成内容与现实之间的界限变得越来越模糊,如何确保内容的真实性和透明性也成为了一个重要问题。以前都说“有图有真相”,结果发现图可以P;再到视频时代,又有人说“有视频有真相”,结果现在视频也可以AI生成。如何辨别真伪,也成为摆在我们每个普通人面前一个非常重要的课题了。



人类历史上,我们与技术的互动屡见不鲜,但没有哪一种技术像人工智能一样前所未有的参与我们的生活,甚至决定我们的生活。因此,了解数字技术的潜力和风险,以及认识到它所建构的“真实”是很重要的一件事情。


 

要想在智能世界依然保持聪明,就像格尔德·吉仁泽在书中所说:“保持聪明就意味着我们要了解数字技术的潜力和风险,这样才能让我们在充满算法的世界中保持主导地位,不被人工智能打败。”

 

因此,要想在智能世界保持聪慧,我们应该以冷静的敬意而不是毫无根据的敬畏或怀疑来看待数字技术,让数字世界成为我们想要生活的世界。



@THE END

应广大粉丝要求,我们建立了一个【领导者管理交流群】,小伙伴们热情踊跃,目前人数已经上万人了,不能直接进群啦,想要进群的添加小编微信,拉你进群。两个添加其一即可!

欢迎加入领导者社群

文章来源 领导者养成笔记「ID:GoToLead 」,转载请公众号回复“转载

版权说明 们尊重原创者版权,除我们确实无法确认作者外,我们都会注明作者和来源。在此向原创者表示感谢。本文所用视频、图片、文字如涉及作品版权问题,请第一时间告知,我们将根据您提供的证明材料确认版权立即删除内容;本文内容为原作者观点,并不代表本公众号赞同其观点和对其真实性负责。

【声明】内容源于网络
0
0
领导者管理笔记
关注我,与100万领导者一起学组织和管理。张三峯,15年500强高层管理经验,“人人都是领导者“理念推动者,“商业新知”管理十佳创作者,多家公司管理咨询顾问。
内容 0
粉丝 0
领导者管理笔记 关注我,与100万领导者一起学组织和管理。张三峯,15年500强高层管理经验,“人人都是领导者“理念推动者,“商业新知”管理十佳创作者,多家公司管理咨询顾问。
总阅读0
粉丝0
内容0