至此已成艺术的 Sora,是从哪条技术路线发展出来的?

-
论文标题:World Models -
作者:David Ha、Jurgen Schmidhuber -
机构:谷歌大脑、NNAISENSE(Schmidhuber 创立的公司)、Swiss AI Lab -
论文链接:https://arxiv.org/pdf/1803.10122.pdf
-
论文标题:VideoGPT: Video Generation using VQ-VAE and Transformers -
作者:Wilson Yan、Yunzhi Zhang、Pieter Abbeel、Aravind Srinivas -
机构:UC 伯克利 -
论文链接:https://arxiv.org/pdf/2104.10157.pdf
-
论文标题:NÜWA: Visual Synthesis Pre-training for Neural visUal World creAtion -
作者:Chenfei Wu、Jian Liang、Lei Ji、Fan Yang、Yuejian Fang、Daxin Jiang、Nan Duan -
机构:微软亚洲研究院、北京大学 -
论文链接:https://arxiv.org/pdf/2111.12417.pdf
-
论文标题:Masked autoencoders are scalable vision learners -
作者:Kaiming He、Xinlei Chen、Saining Xie、Yanghao Li、Piotr Dollar、Ross Girshick -
机构:Meta -
论文链接:https://arxiv.org/abs/2111.06377
-
论文标题:High-resolution image synthesis with latent diffusion models -
作者:Robin Rombach、Andreas Blattmann、Dominik Lorenz、Patrick Esser、Bjorn Ommer -
机构:慕尼黑大学、Runway -
论文链接:https://arxiv.org/pdf/2112.10752.pdf
-
论文标题:Photorealistic Video Generation with Diffusion Models -
作者:李飞飞等 -
机构:斯坦福大学、谷歌研究院、佐治亚理工学院 -
论文链接:https://arxiv.org/pdf/2312.06662.pdf

