
1、科大讯飞智文 2.0 版本发布:内置 AI PPT 编排创作引擎,基于星火大模型
2、马斯克:人工智能模型 Grok 2 测试版即将发布
3、ReSyncer:一个多功能统一模型,可以实现音视频口型同步、说话风格迁移和换脸
高保真度的音频同步口型视频:ReSyncer 可以制作出非常逼真、准确地跟随音频同步的嘴部动作视频。
个性化微调:允许用户对生成的内容进行个性化调整,以满足不同的需求。
视频驱动的口型同步:除了音频,它还可以根据其他视频的嘴部动作来驱动同步,让新视频中的角色模仿已有视频中的说话动作。
说话风格迁移:ReSyncer 可以将一个人的说话风格(如语气、节奏)迁移到另一个人身上。
-
人脸交换:它还可以在视频中替换说话者的面部,同时保持口型与音频的同步。(@小互 AI)
4、OpenAI 发布 GPT-4o 模型卡:概述 AI 安全和风险缓解措施
5、微软 Copilot AI 被指可被黑客操纵,轻松窃取企业机密
6、The GIT Playlist
1、Andrej Karpathy:RLHF 并不是真正的强化学习
2、扎克伯格:开源是 AI 积极发展的必要条件

