公众号推送改版,星标后准时接收推文
1、2024年2月16日凌晨,OpenAI发布了名为Sora的“文生视频”工具,震撼全球。这一创新技术让无数人在社交媒体上用各种语言惊呼:现实仿佛已不存在。
2、Sora是什么?
3、这是一段提示(Prompt很多软件称它为咒语):
Prompt: Tour of an art gallery with many beautiful works of art in different styles.
(网页翻译)提示:参观艺术画廊,欣赏许多不同风格的精美艺术作品。
4、文生视频。文有了。看看生成的视频怎么样。
5、看完之后,什么感觉?是不是感觉:这……不可能是AI生成的吧?这么丰富的场景真的是AI生成的吗?
6、以前不相信会发生。现在一直在等着到来,现在来了!
7、OpenAI知道你会这么想,所以在官网留了一句话:
所有本页面上的视频都是直接由Sora生成,未经修改。
8、Sora的能耐,还不仅仅是“文生视频”。他还能把两个视频,连在一起,实现无缝过渡。比如这个,从现实的乡村,无缝过渡到虚幻的城市。
,时长00:17
9、这样的视频,还有很多。Sora还能做很多很多其它事。官网也有很多视频介绍,这里放个竖屏的,,时长00:40
10、比起Sora所生成的震撼视频,其背后蕴含的意义以及对人工智能整体发展的影响更为深远。为此,我特地查阅了OpenAI官方公布的Sora技术文档,并进行了深入的分析。
11、看完之后我发现,这份技术文档,比那些不可思议的视频,更让人震撼。
12、Sora的工作原理基于OpenAI在人工智能领域的深厚积累,特别是自然语言处理和计算机视觉两大核心技术。
它利用先进的深度学习算法和大规模数据集进行训练,从而实现了从文字描述到视频内容的转换。这种转换并不是简单的动画或图像生成,而是基于自然语言处理和计算机视觉的复杂计算。AI官方公布的技术文档虽然没有深入泄露Sora的具体技术细节,但它为我们揭示了这一创新工具的基本原理,从而为我们理解其对人工智能整体发展的意义提供了重要线索。
其次,Sora在生成视频时,能够理解和分析输入的文字描述,从中提取关键信息和意图。
从文档中我们可以了解到,Sora的核心在于其强大的文本到视频生成能力。然后,它利用生成对抗网络(GANs)和强化学习等技术,生成与描述相匹配的视频内容。这种技术使得视频生成过程更加灵活和可控,可以根据用户的不同需求进行调整和优化。它能够通过深度学习技术,理解并解析输入的文本信息,然后将其转化为高度逼真的视频内容。
13、简单来说,Sora通过学习视频,来理解现实世界的动态变化,并用计算机视觉技术模拟这些变化,从而创造出新的视觉内容。
14、当然,Sora目前还是有一些缺点存在。一是容易混清提示的交间细节并且难以准确模拟复杂场景中的物理现象。二是无法理解一个事例中包含的因果关系
15、比如,你咬一口食物,食物应该出现一个咬痕。这是“物理规律”。如果咬完之后,食物还是完整的,那就不符合“物理规律”。
16、大部分的视频软件,并不理解“物理规律”。他们处理的对象,只是画面。而不是画面里的食物和人。但是Sora,已经似乎开始有一些理解。当Sora学习人咬食物的视频时,它记住的,不仅是食物和嘴在一起的“具体画面”,还有“咬就会有痕”这个“物理规律”。以后生成视频时,一旦有“咬”这个动作,Sora就会知道,下面应该出现一个咬痕了。虽然这两点做的还不够行,比如里面吹蜡烛后蜡烛还是没灭的不合理。
17、如果OpenAI的最终目标是创建一个通用的“物理世界模拟器”,也就是为真实世界建立模型,那么Sora的发布可以被视为这一宏大愿景的重要里程碑。
18、而Sora,只是验证了,这条道路可行的一个里程碑。
19、如果能够从视频中学习物理规律,那么未来确实有可能从摄像头中学习。
这意味着,AI可以通过分析摄像头捕捉到的实时视频流,来理解和推断物理世界中的运动和变化。这种能力将极大地增强AI对环境的感知和理解,为各种应用提供强大的支持。
想象一下,给AI装上一双“眼睛”,让它满世界跑,会发生什么呢?首先,这样的AI将能够实时地感知和理解周围的环境,包括道路、行人、车辆、建筑物等。它将能够自主导航、避开障碍物、进行复杂的物理交互等。这样的技术将在自动驾驶、机器人技术等领域发挥重要作用。
更进一步,如果把全世界的公共摄像头都开放给OpenAI,那么他们就可以构建一个前所未有的世界
20、Sora的出现,可能意味着,通用人工智能(AGI),正在加速到来。
21、这才是OpenAI,真正想做的事情。
22、Sora来了,通用人工智能还会远吗?
23、普通人现在能使用openai的文本生成视频工具Sora吗?
24、答案是:不能用。Sora目前还没有对公众开放,具体的开放时间,也是未知的。从美国权威的科技网站《麻神理工科技评论》上得知需要再过一段时间才能到我们使用。
25、Sora的技术文档和官网我放在阅读原文的,有需要的小伙伴可以去看看
有意建交流群,想进添加备注“进群”

END
关注不迷路
分享、在看与点赞,至少我要拥有一个吧
点击 ”阅读原文 “获得Sora入口

