大数跨境

【AI资讯】Github 推出 Spark AI 工具:可通过日常语言描述构建完善应用功能...

【AI资讯】Github 推出 Spark AI 工具:可通过日常语言描述构建完善应用功能... 软道科技
2024-11-01
2

资讯

直通车

SOFT STAO



Github 推出 Spark AI 工具:可通过日常语言描述构建完善应用功能

Github 推出了 Spark 工具。该工具允许用户仅通过日常语言描述就能构建完善的应用功能,无需编写代码和具备深厚编程专业知识。用户只需详细解释希望开发的应用功能,从托管到数据存储等复杂技术细节均由 Spark 自动处理。在描述应用想法时,用户可实时看到应用构建过程,还能以对话方式请求更改,系统会给出不同版本的修改方案供比较选择。目前 Spark 处于技术预览阶段,GitHub 计划通过等待名单系统逐步扩大用户访问。这种推出方式表明其希望根据早期用户反馈不断优化技术,这一创新可能会彻底改变软件开发方式,降低应用开发门槛至数百万非程序员可接触的水平。





Stability AI :轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型

Stability AI推出全新Stable Diffusion3.5Medium模型,实现了高性能与普及性的完美平衡。这款AI绘画工具免费开放商用,采用MMDiT-X架构,解决了普通用户的硬件门槛问题,实现了人人可用的愿景。技术创新方面整合了三种预训练文本编码器,引入QK标准化技术提升训练稳定性,前12个变换层中的双重注意力模块设计显著提升图像质量和排版效果。




ChatGPT 的高级语音模式(AVM)登陆 Windows 和 Mac 平台

OpenAI 宣布 ChatGPT 的高级语音模式(AVM)现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行,能让用户像与真人对话一样交流,提供更自然、实时的对话体验且能感知回应用户情绪。该功能在 7 月首次向测试用户开放,9 月底向付费订阅用户推出,OpenAI 透露免费用户也将有机会体验,欧盟地区的 Plus 和 Free 用户需等待。就在前一天,OpenAI 还宣布了 ChatGPT 网页版聊天历史搜索这一新功能,方便用户调出聊天记录参考或继续上次中断的聊天。





字节跳动:推出AI模型社区平台炉米Lumi 类似Liblib和CIvitai

字节跳动最新推出的AI模型分享社区平台炉米Lumi,展示其在AI领域的全面布局策略。平台提供模型上传分享、Workflow搭建和LoRA训练功能,目前仅向白名单用户开放。与LiblibAI相似,炉米Lumi将成为字节跳动在AI领域的重要布局。





微软开源 OmniParser ,秒懂屏幕截图

微软开源 OmniParser 的 AI 工具,OmniParser 作为纯视觉基础工具,不依赖额外上下文数据,能理解复杂图形用户界面,结合多种模块可跨平台工作,将屏幕元素转换为结构化数据。它在多个基准测试中表现优越,能提升 GPT-4V 对图标的标记准确率,有效解决当前 GUI 交互模型缺陷,拓宽了智能体应用范围,为开发者提供强大工具。





Meta AI 开源 LongVU,过滤冗余帧,高效精准理解长视频内容

Meta AI 推出 LongVU,这是一种全新的时空自适应压缩机制,大幅提升长视频的语言理解能力。该技术巧妙地运用 DINOv2 特征,有效地剔除冗余帧,并且借助跨模态查询达成特征的选择性压缩。在各类视频理解基准测试中,LongVU 展现出卓越非凡的性能,特别是在长视频理解任务方面,更是力压其他方法。







【声明】内容源于网络
0
0
软道科技
广州市软道信息科技有限公司,专注于大宗商品产业链智慧升级,数智物流技术服务,企业移动互联化产业改造。
内容 0
粉丝 0
软道科技 广州市软道信息科技有限公司,专注于大宗商品产业链智慧升级,数智物流技术服务,企业移动互联化产业改造。
总阅读0
粉丝0
内容0