9.18-9.24周报 | 感织科技- 大数跨境

首页

9.18-9.24周报 | 感织科技

感织科技

2023-09-25

导读：9.18-9.24，大模型领域发生了哪些事情？

9.18-9.24

大模型周报

感织科技

极越：全球首台 AI 汽车机器人

8月25日2023成都车展上，极越01迎来首发亮相。极越是由吉利与百度联合打造的全新品牌，官方对其定义为“汽车机器人战略合作项目”。

极越 01 号称是「全球首台 AI 汽车机器人」，将融合文心一言的全面能力，打造首个针对智能汽车场景的大模型人工智能交互体验，支持汽车机器人实现自然交流的再进阶。

据了解，极越 01 将是中国首发高通骁龙 8295 智舱芯片的车型。骁龙 8295 是最强的车机芯片，采用先进的 5nm 工艺、8 倍于 8155 的恐怖算力。在安兔兔车机性能榜单中，其跑分近 70 万，几乎是骁龙 8155（38 万分）的 2 倍。

（来源：汽车之家）

HiDream.ai 「智象视觉多模态生成式大模型」重磅发布，Pixeling可使用中文提示词

2023年9月20日，通用人工智能创新发展大会在合肥召开，HiDream.ai 智象未来创始人兼CEO梅涛院士在会上正式发布了「智象视觉多模态生成式大模型」，并展示了HiDream.ai目前的基础模型能力及应用进展。

「智象视觉多模态生成式大模型」拥有超过60亿参数，能实现文本、图片、视频等多模态内容生成，并通过交互式生成技术实现精准可控的内容生成；同时依托多模态基础模型强大的底座能力，可快速适配客户专有领域应用。自8月开放内测以来，该模型已经经历了多次迭代更新，旨在为用户提供更优化的创作体验。

基于这一大模型，HiDream.ai推出了面向所有设计师的通用创作工具——Pixeling（千象），支持创意生成、艺术创作、在线编辑等全过程的可视化。Pixeling目前已经支持文字生成图片、文字生成视频、视频编辑等功能，并计划未来推出更多的创作功能。目前，Pixeling不仅可用英文Prompt，还支持中文的提示词。

（来源：阿尔法公社）

大模型竟塞进自动驾驶，AI会解说自己怎么开车了！

英国的自动驾驶创业公司Wayve由出身剑桥大学的AI专家Alex Kendall创立，近日它们推出的LINGO-1为自动驾驶赋予了“语言”。

它们推出了LINGO-1，将大语言模型与自动驾驶技术深度融合，使车辆能够对其行为进行解释，例如解释为何在红灯前停车或为何准备左转。这一技术的核心在于一个专门的数据集，其中包含了专业驾驶员的驾驶解说，结合图像、语言和行动数据。

这种结合使得自动驾驶系统不再是一个“黑盒”，而是可以与人类进行交互和解释其决策的系统。LINGO-1的推出，不仅提高了自动驾驶的可解释性，还为其带来了更高的安全性和效率。未来，这种结合自然语言的自动驾驶技术有望为行业带来革命性的变革。

（来源：阿尔法公社）

谷歌 Bard 人工智能聊天机器人升级：已支持插件功能

9 月 19 日，人工智能聊天机器人谷歌 Bard 发布了最新的更新，增加了对谷歌应用的插件支持，包括 Gmail、Docs、Drive 等。谷歌表示，这是 Bard 迄今为止功能最强大的版本，可以在全球各种语言和国家中提高协作效率。

谷歌应用的插件可以让 Bard 访问和使用来自 Maps、YouTube、Hotels 和 Flights 等应用的实时信息，并且可以随时关闭。用户只需在 Bard 的界面右上角点击插件图标，或者在提示框中输入「@」加上插件的名称，就可以快速选择一个插件。例如，用户可以输入「@Maps」来让 Bard 显示地图信息，或者输入「@YouTube」来让 Bard 播放视频。

除了插件支持外，谷歌 Bard 还增加了一个「公共链接分享」功能，允许用户将自己与 Bard 的对话分享给任何人，他们可以在自己的设备上继续对话。此外，Bard 还可以「复核」自己的答案。每个答案的底部都有一个「G」按钮（代表谷歌），用户可以点击该按钮让 Bard 在谷歌上再次检查自己的回答是否正确。

谷歌 Bard 目前已经开放公共预览，用户可以在网上免费体验。

（来源：IT之家）

阿里旗下公司新增人工智能品牌，发布多款 AIGC 终端与个性化助手

9 月 19 日，阿里巴巴旗下人工智能业务公司未来精灵正式面世。六年来广为人知的「天猫精灵」仍将是唤醒词之一，但在最新的 AI 操作系统驱动下，一个精灵将变成万千精灵，每个人都能创建全天候、个性化的智能助手。

当天，未来精灵还发布三款 AIGC 终端新品，与过去音箱类家庭终端有较大差异，用户将在更多移动场景使用大模型：

1. 未来精灵 AR 眼镜 - 首款原生搭载精灵大模型的 AR 眼镜，语音对话展开更多 AR 使用场景。与雷鸟创新合作开发，使用 MicroLED + 衍射光波导显示方案，1670 万色双目全彩显示，峰值入眼高达亮度 1500nits，对比度高达 100000:1，在户外也能保持明亮清晰。支持户外全双工连续对话，实时多语言互译，拍图翻译功能；并将用大模型 + 插件的方式提供实时地理交通导航、接入风格多样的智能音乐 DJ。

2. 未来精灵 Sound 随声筒 - 具有 30 小时长续航能力，多种氛围灯效，就算到了野外场景，也能拥有个性化助手。通过精灵智能声学的调试，具有户外和室内的不同声音表现。实现了高电压高功率高瞬态的声学设计，在峰值功率情况下，声音表现稳定，还能有业内评测最高的唤醒和识别率。

3. 未来精灵还将在 10 月发布一款面向儿童的新型智能平板。

（来源：机器之心）

《权游》作者等多名作家起诉 OpenAI 侵犯版权

《权力的游戏》原著作者乔治·马丁等多名作家起诉 OpenAI 侵犯版权。此前已有作家对生成式人工智能公司使用他们的书来训练人工智能模型采取法律行动。据了解，美国作家协会和乔纳森·弗兰岑、约翰·格里沙姆、乔治·马丁等 17 位知名作家在纽约南区提起诉讼。原告希望将该诉讼归类为集体诉讼。

（来源：新浪财经）

微软推出跨必应、Edge 和 Win11 的统一 Copilot AI 助手

9 月 21 日消息，微软刚刚宣布将基于生成式人工智能的数字助理 Copilot 推广到更多软件产品中，包括 Windows 11、Edge 网络浏览器、Bing 搜索引擎，以及各种 Microsoft 365 产品。

微软之前已经发布了 Microsoft 365 Copilot，这是一个能够在其一系列生产力应用程序（如 Word 和 Excel）中工作的智能助手。现在这个 Copilot 以及在 Windows 系统和 Edge 中的其他单独的 Copilot，都将被简单地称为 Copilot。

这个新的统一 Copilot 将于 9 月 26 日开始在所有收到 Windows 11 23H2 更新的设备上提供。

（来源：IT 之家）

OpenAI 发布 DALL·E 3：新版文字转图像工具

9 月 21 日下午消息，OpenAI 发布了一个名为 DALL·E 3 的工具，这是该公司文本转图像工具的最新版本，它使用了广受欢迎的人工智能聊天机器人 ChatGPT 来帮助使用者填写提示。

该公司表示，DALL·E 3 将于今年 10 月份通过 API 提供给 ChatGPT Plus 用户和企业客户。用户可以输入图像请求，并通过与 ChatGPT 的对话调整提示。OpenAI 在一份声明中表示：「DALL·E 3 可以将细微的要求转化为极其详细和准确的图像。」

OpenAI 称，该工具的最新版本将有更多保障措施，例如限制其生成暴力、成人或仇恨内容的能力。

（来源：新浪科技）

YouTube 推出一系列 AI 工具：可提供视频创作建议、生成背景及多语言配音

9 月 21 日消息，YouTube 在创作者大会「Made on YouTube」上宣布将推出一系列由 AI 驱动的创作者工具。包括由 AI 生成的照片、视频背景，以及视频主题指导及建议工具、音乐搜索工具。汇总如下：

1. Dream Screen（梦幻屏幕）：可借助 AI 来生成视频、照片，创作者可以将它们用作 YouTube 短片的背景画面，随后再行插入自己的内容。在该功能上线之初，创作者们可以通过输入提示或指令来生成背景，但 YouTube 希望创作者最终能够使用 AI 工具来重新混合、编排现有内容，从而创造出新的内容。

2. AI Insights（视频主题创意和大纲生成器）：该功能将会被集成在 YouTube Studio 创作者管理平台中，AI 可通过创作者的个人情况和受众的潮流趋势，对视频主题进行个性化定制。

3. 基于 AI 的音乐推荐系统：可根据创作者对视频特征、要点的描述，为其推荐适当的背景音乐或音频。

4. Aloud（AI 配音功能）：同样集成在 YouTube Studio 内部，只需点击一下就可由 AI 生成视频（母语以外）的另一种语言配音，创作者可在将其添加到视频之前预先进行检查。该工具目前正开放小范围内测，明年将面向更大范围开放。

（来源：IT 之家）

9.34B参数量超越GPT-4！「数学通用大模型」MAmmoTH开源：平均准确率最高提升29%

滑铁卢大学、俄亥俄州立大学、香港科技大学、爱丁堡大学的研究团队联合开源了专为「通用数学问题」设计的大模型MAmmoTH及其指令调优数据集MathInstruct。

MAmmoTH系列在9个数学推理数据集上的表现显著优于现有开源模型，平均准确率提高了12%至29%。特别是，MAmmoTH-34B模型在MATH数据集上的准确率达到了46%，超越了GPT-4的结果。

数学推理问题长期是语言模型的难题，而MAmmoTH的成功为此提供了新的解决方案。该模型结合了思维链（CoT）和思维程序（PoT）的方法，能够处理从基础到高级的各种数学问题。此外，研究人员还开发了MathInstruct数据集，涵盖了广泛的核心数学领域，如算术、代数、概率、微积分和几何等。

（来源：阿尔法公社）

新 AI 模型成功预测有害基因突变

9 月 20 日消息，英国「深度思维」（DeepMind）公司的人工智能工具「阿尔法错义」（AlphaMissense）已对 2 万种人类蛋白质中的 7100 万种可能的错义突变进行了检测，通过找出哪些小突变可能具有破坏性，来帮助医生确定导致遗传疾病的「罪魁祸首」。相关论文刊发于最新一期《科学》杂志。

几乎每个人出生时都携带有 50—100 个父母没有的突变，这导致了个体之间巨大的基因差异。对医生来说，对某个病人的基因组进行测序以找出病因极具挑战性，因为可能有成千上万个突变与这种疾病有关。「阿尔法错义」应运而生，旨在预测这些基因突变是否有害。

研究人员评论道，「阿尔法错义」在几项不同的性能测试中「表现优异」，将有助于科学家确定哪些致病突变应优先研究。

（来源：科技日报）

联系我们团队项目网站

关于我们

Human+是由厦门大学信息学院郭诗辉副教授带领的研究团队，为了让每个人能够更好的去运动而研发了智能服装，并以传说中解决人们穿衣问题的嫘祖命名研发产品。我们致力于通过智能服装提高用户的运动能力，但是又不仅仅局限于运动方向。团队将智能服装作为载体，应用于运动，医疗，动作捕捉等多领域。团队中集合了一群才华横溢的小伙伴，每个人都拥有着自己的特长。团队中不仅仅有计算机领域的人才，还有着市场，美工，营销，硬件，财务等多方位高水平专业性人才。在团队的共同努力下，围绕智能服装，开展一流的研究，沉淀有价值的系统。

Human+ is a research team led by Guo Shihui, an associate professor from the School of Information Technology, Xiamen University. In order to make everyone better able to exercise, Human+ developed intelligent clothing, which was named Lei Zu, a legendary designer who solves people's dressing problems. In this team, there are a group of talented friends, each of whom has his own special skills. There are not only computer talents in the team, but also marketing, art, marketing, hardware, finance and other high-level professional talents. With the joint efforts of the team, we will carry out first-class research and precipitate valuable systems around smart clothing.

Human+ aims to improve users' movement ability through smart clothing, but not just in the direction of movement. Our team uses smart clothing as a carrier, which is applied in many fields such as sports, medical treatment and motion capture.

【声明】内容源于网络

感织科技

使命：让每个人更好地运动/Make A Better Move愿景：通过智能服装提高用户的运动能力战略：围绕智能服装，开展一流的研究，沉淀有价值的系统

内容 15

粉丝 0

感织科技使命：让每个人更好地运动/Make A Better Move愿景：通过智能服装提高用户的运动能力战略：围绕智能服装，开展一流的研究，沉淀有价值的系统

总阅读8

粉丝0

内容15