GPT-4 Turbo 融合视觉能力;Google 新添 AI 视频应用 Vids丨 RTE 开发者日报 Vol.181
RTE开发者社区
2024-04-10
2
导读:本期关键词:AI 视频、Vision Pro、视觉能力
开发者朋友们大家好: 这里是「RTE 开发者日报」,每天和大家一起看新闻、聊八卦。我们的社区编辑团队会整理分享 RTE (Real Time Engagement) 领域内「有话题的新闻」、「有态度的观点」、「有意思的数据」、「有思考的文章」、「有看点的会议」,但内容仅代表编辑的个人观点,欢迎大家留言、跟帖、讨论。 本期编辑:@CY,@JLT,@鲍勃
01 有话题的新闻
1、英特尔发布 Gaudi 3 AI 芯片:性能超越英伟达 H100,第三季度上市
4 月 9 日 Vision 2024 活动中,英特尔发布了新一代 Gaudi 3 AI 芯片,并将于 2024 年第三季度通过 OEM 系统大批量上市。据介绍,新款 Gaudi 3 与英伟达 H100 相比训练性能提高了 170%,推理能力提高了 50%,效率提高了 40%,但成本却低得多。 此外,英特尔还为其数据中心 CPU 产品组合推出了全新品牌命名:原代号为 Granite Rapids 和 Sierra Forest 的芯片现在将被称为「Xeon 6」系列。这些芯片计划于今年上市,并将支持全新性能提升的标准化 MXFP4 数据格式。 英特尔同时宣布正在开发用于以太网网络的 AI NIC ASIC 以及 AI NIC 小芯片。(@IT 之家)
2、融合视觉能力,OpenAI 向开发人员提供 GPT-4 Turbo with Vision
OpenAI 宣布,具有视觉能力的最新 GPT-4 Turbo 模型 GPT-4 Turbo with Vision 现已通过 OpenAI API 向开发人员普遍提供。该模型延续了 GPT-4 Turbo 系列 128,000 个 token 的窗口大小以及截止至 2023 年 12 月的知识库,最大的革新之处在于其新增的视觉理解能力。 在过去,开发者需要调用不同的模型来处理文本和图像信息,而 GPT-4 Turbo with Vision 则将两者合二为一,极大简化了开发流程,并带来了广泛的应用前景。(@CSDN)
3、Vision Pro 开发者称苹果过度注重隐私,潜能难发挥
据外媒报道,苹果为了避免重蹈 Google Glass 的覆辙,在 Vision Pro 的隐私保护上设置了非常严格的限制,这在一定程度上限制了第三方开发者发挥创意的空间。Vision Pro 的开发者并不能直接获取设备摄像头的数据,他们只能访问「周围环境数据」。 这份数据由摄像头和激光雷达数据共同生成,可以构建周围环境的三维模型。报道援引了前苹果员工的说法,苹果之所以如此重视隐私,部分原因是为了避免 Vision Pro 变成第二个 Google Glass。十多年前,Google Glass 因为内置摄像头而引发了巨大的隐私争议,让周围的人感到不安。(@IT 之家)