GPT-4 Turbo 融合视觉能力；Google 新添 AI 视频应用 Vids丨 RTE 开发者日报 Vol.181



GPT-4 Turbo 融合视觉能力；Google 新添 AI 视频应用 Vids丨 RTE 开发者日报 Vol.181

RTE开发者社区

2024-04-10

导读：本期关键词：AI 视频、Vision Pro、视觉能力

开发者朋友们大家好：

这里是「RTE 开发者日报」，每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE （Real Time Engagement）领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」，但内容仅代表编辑的个人观点，欢迎大家留言、跟帖、讨论。

本期编辑：@CY，@JLT，@鲍勃

有话题的新闻

1、英特尔发布 Gaudi 3 AI 芯片：性能超越英伟达 H100，第三季度上市

4 月 9 日 Vision 2024 活动中，英特尔发布了新一代 Gaudi 3 AI 芯片，并将于 2024 年第三季度通过 OEM 系统大批量上市。据介绍，新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%，推理能力提高了 50%，效率提高了 40%，但成本却低得多。

此外，英特尔还为其数据中心 CPU 产品组合推出了全新品牌命名：原代号为 Granite Rapids 和 Sierra Forest 的芯片现在将被称为「Xeon 6」系列。这些芯片计划于今年上市，并将支持全新性能提升的标准化 MXFP4 数据格式。

英特尔同时宣布正在开发用于以太网网络的 AI NIC ASIC 以及 AI NIC 小芯片。（@IT 之家）

2、融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

OpenAI 宣布，具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库，最大的革新之处在于其新增的视觉理解能力。

在过去，开发者需要调用不同的模型来处理文本和图像信息，而 GPT-4 Turbo with Vision 则将两者合二为一，极大简化了开发流程，并带来了广泛的应用前景。(@CSDN)

3、Vision Pro 开发者称苹果过度注重隐私，潜能难发挥

据外媒报道，苹果为了避免重蹈 Google Glass 的覆辙，在 Vision Pro 的隐私保护上设置了非常严格的限制，这在一定程度上限制了第三方开发者发挥创意的空间。Vision Pro 的开发者并不能直接获取设备摄像头的数据，他们只能访问「周围环境数据」。

这份数据由摄像头和激光雷达数据共同生成，可以构建周围环境的三维模型。报道援引了前苹果员工的说法，苹果之所以如此重视隐私，部分原因是为了避免 Vision Pro 变成第二个 Google Glass。十多年前，Google Glass 因为内置摄像头而引发了巨大的隐私争议，让周围的人感到不安。（@IT 之家）

4、Google Vids 让人人都成为视频创作达人

4 月 9 日，谷歌在其年度开发者大会 Google Cloud Next '24 上推出了 Workspace 家族的新成员——AI 驱动的视频创作应用 Vids，Google Vids可以帮助用户生成视频内容的分镜脚本、选择风格、编辑草稿，提供预录制的旁白功能。有了 Vids，用户可以在工作中轻松创建和分享视频内容。

谷歌将 Vids 定位为继文档、表格、幻灯片之后的第四生产力应用。Vids 大幅降低了视频创作门槛，让员工可以更高效地在日常工作中运用视频这一表现力丰富的媒体形式。Vids 有望在企业内部掀起一股「人人都是视频创作者」的新浪潮。（@kate 人不错）

有态度的观点

1、马斯克最新访谈：中国 AI 不会落后于西方，中国汽车公司最具竞争力

马斯克在 X Space 的直播中接受访谈表示，中国有很多非常聪明的人，他们在 AI 上不会落后于世界其他地方，也不会落后于美国。

马斯克还称，在电动汽车或一般汽车领域，中国汽车公司是迄今为止最具竞争力的，这是最严峻的竞争挑战，他们制造出很棒的汽车，并且非常努力。（@Web3 天空之城）

2、罗永浩回应为何不造车：现在造车已晚，9 月将发布科技产品

在近日的直播中，罗永浩谈到自己为何不造车，他幽默回应：「有人说你造车我必买，少来，我当时做手机时你就这么说的」。罗永浩解释自己过去几年里曾考虑过造车，但他认为现在造车资本要求更高，融资要求更高，难度更大，造车的周期更长，没有成熟的供应链解决完美的生产制造，所以他评估下来觉得现在造车已经晚了。

对于备受关注的小米首款汽车 SU7，罗永浩此前评价称：小米很可能继平价手机市场之后，在大众消费车市场上重新上演良币驱逐劣币的史诗性一幕。罗永浩还透露自己即将在 9 月份举办发布会，发布一款科技产品，定价为 199 和 299 美元，不过他并没有透露产品的具体信息。（@IT 之家）

有思考的文章

1、《:-）表情符号的诞生、传播和发展》

「:-）和 :-（这些表情符号不是从古代流传下来的，它们竟然有发明者！」( @The Nexus)

@杜金房：早期的网络社交，简单又优雅。

写在最后：

我们欢迎更多的小伙伴参与「RTE 开发者日报」内容的共创，感兴趣的朋友请通过开发者社区或公众号留言联系，记得报暗号「共创」。

对于任何反馈（包括但不限于内容上、形式上）我们不胜感激、并有小惊喜回馈，例如你希望从日报中看到哪些内容；自己推荐的信源、话题、活动等；或者列举几个你喜欢看、平时常看的内容渠道；内容排版或呈现形式上有哪些可以改进的地方等。

【声明】内容源于网络

RTE开发者社区

RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流，我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源，我们将陪跑开发者，共享、共建、共成长。

内容 1122

粉丝 0

RTE开发者社区 RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流，我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源，我们将陪跑开发者，共享、共建、共成长。

总阅读197

粉丝0

内容1.1k

GPT-4 Turbo 融合视觉能力；Google 新添 AI 视频应用 Vids丨 RTE 开发者日报 Vol.181

1、英特尔发布 Gaudi 3 AI 芯片：性能超越英伟达 H100，第三季度上市

2、融合视觉能力，OpenAI 向开发人员提供 GPT-4 Turbo with Vision

3、Vision Pro 开发者称苹果过度注重隐私，潜能难发挥

4、Google Vids 让人人都成为视频创作达人

1、马斯克最新访谈：中国 AI 不会落后于西方，中国汽车公司最具竞争力

2、罗永浩回应为何不造车：现在造车已晚，9 月将发布科技产品

1、《:-） 表情符号的诞生、传播和发展》

1、《:-）表情符号的诞生、传播和发展》