大数跨境

碾压式登顶!Google 新模型让视频秒变网页,AI 开发范式彻底改写

碾压式登顶!Google 新模型让视频秒变网页,AI 开发范式彻底改写 元龙数字智能科技
2025-05-07
3

碾压式登顶!

Google新模型

让视频秒变网页

AI 开发范式彻底改写


在人工智能领域竞争日益白热化的当下,Google 的每一次动作都牵动着行业的神经。继此前以 Gemini 2.5 pro 在聊天记录可视化上大放异彩,甚至能处理每日 999+微信群聊的庞大上下文,并输出美观的可视化网页,在 Qwen3 的跑分中也彰显强劲实力,成为不少人默认编程模型后,Google 再次甩出“王炸”,推出 Gemini 2.5 Pro(I/O 版),后台模型调用命名为 Gemini 2.5 Pro Preview 05-06 。

这次更新距离 Google 一年一度的 I/O 大会仅剩不到两周,如此迫不及待的发布节奏,既展现出 Google 对自身技术的强大信心,也透露出在 AI 赛道激烈竞争中的紧迫感。

此次更新的 Gemini 2.5 Pro 05-06 版本,与今年三月 DeepSeek V3 03-24 的更新有着异曲同工之处,都将代码能力提升到了前所未有的高度。而其带来的两大核心亮点,更是引发了业界的广泛关注。在衡量模型代码能力的关键榜单 WebDev Arena 上,Gemini 2.5 Pro 05-06 版本可谓是一鸣惊人。

或许对于许多人来说,WebDev Arena 这个名字稍显陌生,但它的含金量却不容小觑。作为 LMArena 旗下专为评测网页前端开发任务(涵盖 HTML、CSS 和 JavaScript 等)而设立的子榜,WebDev Arena 延续了 LMArena 纯粹盲测的特色。用户提出一个 Prompt 后,LMArena 会给出两个不知出自哪个模型的回答,用户凭借直观感受进行选择,就像拆盲盒一般,完全依靠普通用户的投票来决出优劣,这种机制极大程度地保证了评测的公正性,杜绝了作弊的可能。

当用户要求生成一个 Web 像素猫小游戏时,Gemini 2.5 Pro 05-06 版本与其他模型的差距便清晰可见。在等待一分钟两边全部生成完代码后,生成内容的质量高下立判,Gemini 2.5 Pro 05-06 版本所呈现的效果远远超越对手,让人一眼就能分辨出孰优孰劣,最终毫无悬念地收获用户的青睐。

通过 Bradley-Terry(BT)模型对成对对决中的胜负数据进行分析,估算出每个模型的强度,计算出的 Arena Score 就如同国际象棋、LOL 以及王者荣耀里常用的 Elo 分,直观反映模型的实力。而此次 Gemini 2.5 Pro 05-06 版本结结实实地提高了 147 分,对于熟悉游戏隐藏分机制的人来说,这一分数的提升难度不言而喻,也足以证明该版本在代码能力上的巨大飞跃,成功力压 Claude 3.7 Sonnet,登顶榜首。

如果说代码能力的提升已经足够惊艳,那么 Gemini 2.5 Pro 05-06 版本在视频理解能力上的突破更是令人眼前一亮。该版本在 VideoMME 基准测试中取得了 84.8% 的高分,这一成绩直接带来了极具创新性的应用——将视频转化为可视化网页。以往,人们常常借助 AI 将 PDF、图片等转化为可视化网页,如今视频也加入了这个行列。不过,目前在实际使用中还存在一些问题。Gemini 官网本身不支持视频上传,只能在 AI Studio 里进行操作,但上传过程中又经常出现报错的情况,许多 Reddit 网友都遭遇了同样的困扰。

好在目前通过 YouTube 的在线链接生成可视化网页是可行的。在实际操作中,用户只需打开 AI studio 的官网,将模型调整至 05-06 版,在上传选项中选择 YouTube,然后输入一段视频链接,再搭配合适的可视化 Prompt,模型就能迅速生成代码。以 OpenAI 发在 YouTube 上的 Sora 教程视频为例,经过模型处理后,生成的网页效果令人惊喜。这种将视频转化为网页的功能,在学习场景中具有巨大的应用潜力。比如,当用户在 YouTube 上观看 Blender 教程时,就可以将视频和相关 Prompt 交给 Gemini 2.5 Pro 05-06 版本处理,输出的网页能够以更加直观、交互性更强的方式呈现教程内容,极大地提升学习体验。

然而,尽管 Gemini 2.5 Pro 05-06 版本展现出了强大的实力,但 Google 目前在产品层面仍存在一些亟待解决的问题。首先是命名混乱的情况,从 Gemini 2.5 pro 到 Gemini 2.5 Pro(I/O 版),再到后台的 Gemini 2.5 Pro Preview 05-06 ,以及官网上显示的 2.5 Pro (experimental) ,不同的名称让用户感到困惑,难以明确区分各个版本之间的差异。

其次,产品入口不够清晰,功能的稳定性也有待提高,视频上传功能的诸多问题就是一个明显的例子。不过,不可否认的是,Gemini 2.5 Pro 05-06 版本在技术上的进步是实实在在的,它不再是那个只能依靠 PPT 和论文刷存在感的 Gemini ,也不再是每次都被 OpenAI 抢尽风头的“AI 界汪峰”。

随着 Google I/O 大会的日益临近,人们对 Google 在 AI 领域的下一步动作充满期待。Gemini 2.5 Pro 05-06 版本已经展现出了巨大的潜力,未来 Google 是否会带来更大的惊喜,进一步革新 AI 的应用场景和开发范式,我们不妨拭目以待。

这场 AI 技术的角逐仍在继续,而 Google 凭借此次更新,无疑已经在赛道上占据了一个有利的位置,也为整个行业的发展注入了新的活力,激励着更多的企业和开发者在 AI 领域不断探索创新。 

END

【声明】内容源于网络
0
0
元龙数字智能科技
永做第一 使命第一 向善第一
内容 901
粉丝 0
元龙数字智能科技 永做第一 使命第一 向善第一
总阅读2.2k
粉丝0
内容901