·AI新闻日报·
今日新闻速览

快手旗下的AI视频与图像创作平台可灵AI(Kling AI)近日震撼发布2.0版本,包含全新的视频生成模型和图像生成模型,标志着其全系模型升级。这次升级最亮眼的是引入了开创性的“多模态视频编辑”功能,用户现在可以像编辑文本一样,通过文字、图片甚至视频片段作为参考,对AI生成的视频进行精细的增、删、改操作。同时,新版本在理解用户意图、生成视频的动态效果和画面美感上也大幅提升,让AI更“懂你”,轻松实现复杂创意,大大降低了高质量视频创作的门槛。
多模编辑:全新上线多模态视频编辑功能,支持基于视频、图片和文字进行灵活修改与再创作,让用户对生成内容有更强的控制力。
语义提升:模型能更精准理解复杂、自然的文本指令,包括细致的场景氛围、角色动作和情感变化,生成高度匹配的内容。
动态优化:生成视频的运动流畅性、时序连贯性和运镜效果大幅改善,能更好地呈现复杂动作和细腻情感,实现更逼真的动态效果。
质感升级:画面美学全面优化,色彩、光影、细节表现更出色,可生成具有电影级质感的图像和视频,图生视频能更好保持原图画风。
对从业者: 可灵2.0的多模态编辑能力是AIGC视频领域的一大步,它超越了简单的“文本生成视频”,赋予创作者在生成后精细调整的能力。这种“生成+编辑”的闭环大大增强了AI视频工具的实用性,更能满足专业内容生产(如短剧、广告、动画预览)对可控性的需求。其提出的MVL(多模态视觉语言)概念,探索了更直观的人机交互方式,对整个AIGC领域都有启发。可灵2.0据称在内部评测中表现优于谷歌Veo2和OpenAI Sora,显示中国AI力量在全球竞争中的快速崛起,正不断推动技术前沿。
对普通人: 这意味着制作酷炫、个性化视频变得前所未有的简单。以前需要专业技能和复杂软件才能实现的编辑效果,现在普通用户通过简单的图文或视频示例就能指导AI完成。无论是制作趣味短片、生活Vlog,还是把脑洞大开的想象变成现实,可灵2.0都提供了更强大的工具,让每个人都能轻松享受创作的乐趣。

根据第三方数据,阿里巴巴旗下的夸克AI助手在2025年3月凭借接近1.5亿的全球月活跃用户(MAU),超越了字节跳动的豆包和DeepSeek,荣登中国市场最受欢迎AI应用的宝座。夸克最初是一款云存储和搜索工具,近期依托阿里通义大模型全面升级为“AI超级框”和“AI全能助手”,整合了智能搜索、文档处理、AI写作、文件/视频总结等多种功能,旨在提供一站式信息服务,尤其受到年轻用户的喜爱。
用户领先:2025年3月全球MAU近1.5亿,登顶中国AI应用榜首,显示出强大的用户吸引力。
战略转型:从工具型应用(搜索、网盘)成功转型为集成多种AI能力的“AI超级助手”,满足用户多元化需求。
功能全面:提供智能搜索、AI写作、文档/网页/视频总结、网盘、扫描、学习辅导等一站式服务。
技术依托:基于阿里巴巴通义系列大模型进行能力升级,未来将持续接入最新模型成果。
对从业者: 夸克的成功转型展示了将AI能力融入现有成熟平台(而非从零开始)的巨大优势。通过升级用户熟悉的产品,阿里有效利用了庞大的存量用户基础,快速实现了AI功能的规模化渗透,避免了新应用冷启动的难题,这一策略值得借鉴。夸克在中国市场的领先地位及全球排名(据报道全球第六)反映了中国AI应用市场的巨大潜力,但要从国内成功走向全球领先,仍需克服品牌、功能、地缘政治等多重挑战。夸克的崛起也是中国AI发展战略的一个缩影,激烈的国内竞争(如与豆包、DeepSeek)正催生具有中国特色的“超级应用”形态。
对普通人: 这意味着AI工具正变得更加集成和方便。用户不再需要在多个应用间切换,像夸克这样的“全能助手”能在一个平台内满足搜索信息、存文件、处理文档、获得写作灵感等多种需求,大大提升日常生活和工作的效率。先进的AI能力正以更贴近日常场景的方式服务大众。

谷歌联手佐治亚理工学院和野生海豚项目(WDP),推出了一个名为DolphinGemma的AI模型,旨在分析和理解大西洋斑点海豚复杂的叫声模式。项目利用WDP自1985年以来积累的数十年水下音视频数据,训练AI识别海豚声音(如咔哒声、哨声)中的序列和模式,探索其是否具有类似语言的结构。需要明确的是,DolphinGemma的目标不是直接“翻译”海豚语,而是像大型语言模型预测下一个词那样预测声音序列,帮助科学家研究声音与特定行为(如母子团聚、冲突、求偶)的关联。未来还计划尝试利用AI生成的声音信号与海豚进行简单的双向互动实验。
跨界合作:谷歌将先进AI技术(基于Gemma模型)与长期海洋生物学实地研究结合,利用AI分析复杂生物声学数据。
模式识别:应用类似LLM的序列预测技术分析海豚声音,旨在识别声音模式与社会行为关联,而非直接翻译。
交互探索:计划结合CHAT系统,测试用AI生成或识别特定声音(与物体关联)与海豚进行简单双向交流。
开放共享:计划2025年夏季开源DolphinGemma模型,供全球研究人员使用,促进鲸豚类声音研究。
对从业者: DolphinGemma项目生动展示了AI技术(尤其是类LLM的序列模型)在处理非人类语言、非传统数据类型方面的巨大潜力,为利用AI进行科学发现(特别是理解复杂生物通讯)开辟了新途径。这提示AI从业者思考如何将现有技术迁移到新的科学问题上。该项目将重点放在分析结构和预测序列上,而非追求短期内“翻译海豚语”,体现了科学的严谨性,将AI定位为增强科学家能力的强大工具。谷歌计划开源此模型,有助于推动相关领域研究,并围绕其技术构建生态,提升影响力。
对普通人: 这项研究极具趣味性,满足了我们理解其他智慧生物、探索未知世界的好奇心。虽然离真正“和海豚聊天”还很遥远,但它展示了AI在解码自然奥秘、拓展认知边界方面的惊人潜力。这类项目有助于激发公众对海洋生物保护和科学探索的兴趣。

源自清华大学的AI大模型公司智谱AI(北京智谱华章科技股份有限公司)已于2025年4月14日在北京证监局办理了上市辅导备案,由中金公司辅导,正式启动IPO流程,目标冲击A股上市。这使其成为国内“大模型六小龙”中首家公开启动上市进程的公司。智谱AI成立于2019年,拥有强大的清华技术背景,开发了对标国际先进水平的GLM系列大模型,并推出了ChatGLM、智谱清言AI助手等产品。公司已获得阿里、腾讯、社保基金及多家地方国资等十余轮投资,总融资额超百亿人民币。
启动IPO:正式在北京证监局进行上市辅导备案,迈出冲击资本市场的第一步,或将成中国大模型创业公司第一股。
清华背景:公司由清华大学技术成果转化,核心团队具深厚学术根基。
融资强劲:累计完成超百亿融资,投资方包括阿里、腾讯及国家级基金。
技术实力:研发GLM系列大模型,对标国际,积极推动模型开源与行业应用(已在金融、教育、医疗等领域规模化应用)。
对从业者: 智谱AI启动IPO是中国大模型行业发展的重要里程碑,可能预示着头部玩家开始寻求公开市场的认可与资金,逐步摆脱对风险投资和政府扶持的过度依赖。这反映了领先企业在技术、产品和商业化上达到了一定成熟度,同时也凸显了大模型研发对持续大规模资本的需求。若上市成功,将为其他AI独角兽提供重要参考。其独特的“互联网巨头+国家队资本”投资结构,揭示了中国发展自主可控大模型的战略重要性。然而,被列入美国实体清单等地缘政治因素,可能对其国际化发展构成挑战,选择A股上市或是应对策略之一。
对普通人: 这意味着中国本土研发的先进AI技术正加速成熟和商业化。像智谱AI这样的公司的发展,有望带来更多贴合中国用户习惯和需求的AI产品与服务(已在金融、教育、医疗等行业落地),促进各行各业智能化升级,最终让普通人在工作和生活中享受到AI进步带来的便利。
今日总结
快手可灵AI 2.0发布:核心亮点是引入了多模态视频编辑功能,允许用户通过文本、图片或视频参考来精细修改AI生成的视频内容,同时提升了语义理解、动态效果和画面质感,降低了高质量视频创作门槛。
阿里夸克登顶中国AI应用榜:凭借近1.5亿月活跃用户(2025年3月数据),成为中国市场最受欢迎的AI应用。其成功在于从搜索/网盘工具转型为集成多种AI能力的“AI超级助手”,有效利用了存量用户基础。
谷歌AI尝试理解海豚:推出DolphinGemma模型,利用AI分析海豚复杂的发声模式以识别其中规律,而非直接翻译,旨在辅助海洋生物学研究,并计划开源该模型以促进行业发展。
智谱AI启动IPO辅导:这家源自清华的大模型公司正式启动A股上市流程,成为国内头部AI创业公司中首家公开冲刺IPO的企业,标志着中国大模型产业走向资本市场和商业化成熟的重要一步。
关于我们
🚀 引领企业数字化转型,共塑行业未来。我们专注于打造融合 AI 的定制化 数字化系统,实现业务流程的智能升级与深度整合。依托来自MIT、微软等顶尖科技背景的核心团队,我们助您构建强大的 AI 驱动 基础设施,提升效率,驱动创新,成就行业领先地位。

