【AI资讯】Github 推出 Spark AI 工具：可通过日常语言描述构建完善应用功能...- 大数跨境

首页

【AI资讯】Github 推出 Spark AI 工具：可通过日常语言描述构建完善应用功能...

软道科技

2024-11-01

资讯

直通车

SOFT STAO

Github 推出 Spark AI 工具：可通过日常语言描述构建完善应用功能

Github 推出了 Spark 工具。该工具允许用户仅通过日常语言描述就能构建完善的应用功能，无需编写代码和具备深厚编程专业知识。用户只需详细解释希望开发的应用功能，从托管到数据存储等复杂技术细节均由 Spark 自动处理。在描述应用想法时，用户可实时看到应用构建过程，还能以对话方式请求更改，系统会给出不同版本的修改方案供比较选择。目前 Spark 处于技术预览阶段，GitHub 计划通过等待名单系统逐步扩大用户访问。这种推出方式表明其希望根据早期用户反馈不断优化技术，这一创新可能会彻底改变软件开发方式，降低应用开发门槛至数百万非程序员可接触的水平。

Stability AI ：轻量级AI绘画利器 Stable Diffusion 3.5 Medium模型

Stability AI推出全新Stable Diffusion3.5Medium模型，实现了高性能与普及性的完美平衡。这款AI绘画工具免费开放商用，采用MMDiT-X架构，解决了普通用户的硬件门槛问题，实现了人人可用的愿景。技术创新方面整合了三种预训练文本编码器，引入QK标准化技术提升训练稳定性，前12个变换层中的双重注意力模块设计显著提升图像质量和排版效果。

ChatGPT 的高级语音模式（AVM）登陆 Windows 和 Mac 平台

OpenAI 宣布 ChatGPT 的高级语音模式（AVM）现已登陆 Windows 和 Mac 平台。AVM 基于 OpenAI 最先进的 GPT-4o 模型运行，能让用户像与真人对话一样交流，提供更自然、实时的对话体验且能感知回应用户情绪。该功能在 7 月首次向测试用户开放，9 月底向付费订阅用户推出，OpenAI 透露免费用户也将有机会体验，欧盟地区的 Plus 和 Free 用户需等待。就在前一天，OpenAI 还宣布了 ChatGPT 网页版聊天历史搜索这一新功能，方便用户调出聊天记录参考或继续上次中断的聊天。

字节跳动：推出AI模型社区平台炉米Lumi 类似Liblib和CIvitai

字节跳动最新推出的AI模型分享社区平台炉米Lumi，展示其在AI领域的全面布局策略。平台提供模型上传分享、Workflow搭建和LoRA训练功能，目前仅向白名单用户开放。与LiblibAI相似，炉米Lumi将成为字节跳动在AI领域的重要布局。

微软开源 OmniParser ，秒懂屏幕截图

微软开源 OmniParser 的 AI 工具，OmniParser 作为纯视觉基础工具，不依赖额外上下文数据，能理解复杂图形用户界面，结合多种模块可跨平台工作，将屏幕元素转换为结构化数据。它在多个基准测试中表现优越，能提升 GPT-4V 对图标的标记准确率，有效解决当前 GUI 交互模型缺陷，拓宽了智能体应用范围，为开发者提供强大工具。

Meta AI 开源 LongVU，过滤冗余帧，高效精准理解长视频内容

Meta AI 推出 LongVU，这是一种全新的时空自适应压缩机制，大幅提升长视频的语言理解能力。该技术巧妙地运用 DINOv2 特征，有效地剔除冗余帧，并且借助跨模态查询达成特征的选择性压缩。在各类视频理解基准测试中，LongVU 展现出卓越非凡的性能，特别是在长视频理解任务方面，更是力压其他方法。

【声明】内容源于网络

软道科技

广州市软道信息科技有限公司，专注于大宗商品产业链智慧升级，数智物流技术服务，企业移动互联化产业改造。

内容 0

粉丝 0

软道科技广州市软道信息科技有限公司，专注于大宗商品产业链智慧升级，数智物流技术服务，企业移动互联化产业改造。

总阅读0

粉丝0

内容0