2024年对人工智能而言,是一个具有里程碑意义的一年。在这一年中,AI领域迎来了多个重要更新,涵盖了AI模型、消费产品以及前沿研究等多个方面。
本文将回顾谷歌、微软、OpenAI、xAI、NVIDIA等公司发布的主要AI公告,带您了解2024年人工智能的最新进展及未来趋势。
微软与Surface合作推出的Copilot+PC
微软与Surface联合推出了史上最快、最智能的Windows电脑。搭载AI加速的Copilot+功能,Surface Pro 11代不仅让工作更加高效,也让用户体验到一款重新定义的笔记本电脑。
Whisk人工智能能够根据用户输入的主题、场景及风格创建图像,用户可以通过混合和重新组合这些图像,创作出具有独特风格的数字毛绒玩具、珐琅别针、贴纸等。
Google Photos进一步增强了AI编辑工具,用户可以轻松实现复杂的照片编辑操作,包括Magic Editor、Photo Unblur和Magic Eraser等。部分功能仅限Google One会员及Pixel设备用户使用。
在2024年巴黎的Galaxy Unpacked发布会上,三星推出了Galaxy AI,包含诸如Circle to Search、健康追踪、实时翻译、生成编辑等功能,进一步提升了智能手机的多功能性。
Sora能够根据文本、图像或视频内容,在几秒钟内生成高质量视频。其内置的高级编辑功能,如混音、混合、重新剪辑等,让用户轻松创作并个性化定制视频内容。
Google推出了Veo 2和Imagen 3两款革命性的图像与视频生成模型,这些工具不仅提供了超高质量的媒体创作,还使得创作者能够更便捷地制作出精美的视觉内容。
NVIDIA推出了Jetson Orin Nano超级开发套件,这款微型生成AI超级计算机体积小巧,却能在低功耗下运行如Llama 3.1等复杂AI模型,旨在让开发者、爱好者与学生等广泛群体都能轻松接触AI技术。
Google的Willow芯片创造了一个历史性成就——仅用五分钟便完成了原本需要超级计算机完成的计算任务,并在量子计算领域取得了突破性进展,解决了30年来的技术难题。
Meta推出了Llama 3.1,这是一个拥有4050亿个参数的开源AI模型,成为迄今为止最大的开源AI系统。该系统可以进行编码、解答数学问题、总结文档等任务,并已在Azure、AWS、Google Cloud等平台上线。
Meta推出的Ray-Ban智能眼镜具备播放音乐、拍照、翻译语言以及通过WhatsApp发送语音信息等功能,标志着智能穿戴设备的新一轮创新。
Gemini 2.0带来了图像和音频输出等多模态的进步,结合原生工具使用,促使AI代理进入一个新的时代。它为我们构建更接近通用助手的AI系统提供了新可能。
谷歌的Project Astra是一款能够实时“看”和“听”的AI助手,它甚至能够在必要时代替用户采取行动,开启了AI在个人助理领域的新篇章。
苹果iOS 18.1上的Apple Intelligence
Apple Intelligence功能已在iOS 18.1、iPadOS 18.1和macOS Sequoia 15.1上推出,涵盖了总结通知、邮件和消息内容、移除图像中的干扰物、提升Siri能力等多项功能,提升了用户的智能体验。
Anthropic发布Claude 3.5 Sonnet
Claude 3.5 Sonnet通过多项新功能的推出,进一步提升了其文本与视觉的多模态能力,并能够与计算机的图形界面进行交互,为用户提供了更加直观的体验。
OpenAI推出的高级语音模式,使用户能够通过视频和语音与ChatGPT进行实时互动。这一功能特别适用于分步教程、学习和动态问答环节,极大提升了交互的沉浸感和效率。
2024年对于人工智能来说,无疑是一个突破性的一年。从紧凑型超级计算机到更加智能的照片编辑工具,再到量子计算的突破性进展,这些创新成果展示了AI技术在设备、创意工具与科研领域的巨大潜力。未来,随着AI不断渗透到我们生活的方方面面,人工智能的应用场景将更加广泛,前景更加光明。
END

ChatU可免费申请试用,支持企业私有部署,多引擎AIGC操作系统安全稳定,点击下方公众号一键试用!