-
微软意外曝光38 TB敏感信息 -
英国反垄断监管机构发布七项原则 -
美国防部与谷歌联手打造AI显微镜,助力癌症早期诊断 -
MIT新研究:“三个臭皮匠,顶个诸葛亮” -
瑞·达利欧:每周工作3天?AI或许能帮你 -
MindAgent:新兴游戏互动 -
综述:AI在Web 3.0中的应用 -
综述:聊天机器人中的偏见与公平 -
MIT新研究:拥有世界观的文本到图像生成模型 -
大型语言模型能否理解现实世界的复杂指令? -
TextBind:多轮交错多模态跟读指令
01
微软意外曝光38 TB敏感信息
近日,微软的 AI 研究团队在 GitHub 上发布开源训练数据时,意外暴露了敏感数据。云安全初创公司 Wiz 发现 GitHub 存储库中的 Azure Storage URL 配置错误,导致整个存储帐户都被授权,意外曝露了 38 TB 的敏感信息,其中包括员工个人计算机的备份、微软服务的密码和数万条内部消息。目前,微软已经撤销了 SAS 令牌,并表示没有客户数据曝露。此外,他们还扩展了 GitHub 的安全服务以检测类似问题,提高数据安全。
02
英国反垄断监管机构发布七项原则
为指导 AI 法规和开发公司,英国反垄断监管机构竞争与市场管理局(CMA)制定了七项原则,焦点集中在基础模型上,如 OpenAI 的 GPT-4 和 Meta 的 Llama 2 等大型语言模型。这些原则强调了开发人员和企业应对用户的输出负责任,同时确保广泛访问芯片、处理器和训练数据,提供多样化的业务模型,以及提供透明度和避免反竞争行为。他们强调,制定这些原则是为了保护竞争,防止低性能的 AI 系统扩散。
03
美国防部与谷歌联手打造AI显微镜,
助力癌症早期诊断
据《科创板日报》消息,美国国防部与谷歌合作,研发一种带有人工智能(AI)功能的新型显微镜,可协助医生更早地发现患者体内可能存在癌细胞。美国医生 Nadeem Zafar 在接受采访时表示,这一新产品被称为虚拟实景显微镜(ARM),尽管该技术目前仍在早期阶段,尚未广泛应用于诊疗,但初步研发进展顺利。Zafar 指出,目前已经生产了 13 台 ARM 设备,并正在首都华盛顿的 Mitre 机构进行测试。据估算,每台 ARM 的价格可能在 9 万至 10 万美元之间。
04
MIT新研究:
“三个臭皮匠,顶个诸葛亮”
最近,麻省理工学院(MIT)计算机科学与人工智能实验室(CSAIL)的团队将“三个臭皮匠,顶个诸葛亮”的智慧引入现代技术前沿。他们提出了一种策略,利用多个人工智能(AI)系统来讨论和争论,以达成对给定问题的最佳答案。这种方法赋予这些广泛的语言模型更高的坚守事实数据的能力和决策改进。
该研究的作者之一 Yilun Du 表示:“我们的过程动用多种 AI 模型,每个模型为解决问题提供独特的见解。尽管它们的初始回应可能显得简略或包含错误,但这些模型可以通过审查同行的回应来锐化和改进自己的答案。随着这些 AI 模型参与对话和讨论,它们更有能力识别和纠正问题,提高解决问题的能力,并更好地验证其回应的准确性。“
05
瑞·达利欧:
每周工作3天?AI或许能帮你
传奇投资者瑞·达利欧表示,尽管人工智能(AI)在过去一年成为华尔街热门话题,引发广泛的担忧,但其好处可能会令人震惊。他特别强调了 AI 作为一个重要的变革力量,在提高生产力方面具有潜力。从生产率的角度来看,如果管理得当,工作周可能会减少到 3 天左右。
然而,他警告说,除非进行干预,否则只有社会的一部分群体会受益于这些变化,可能会导致贫富差距扩大。因此,政策制定者需要谨慎考虑如何分享 AI 带来的好处,以避免不平等加剧。
06
MindAgent:新兴游戏互动
大型语言模型(LLMs)有能力在多代理系统中执行复杂的调度,并能协调这些代理完成需要广泛协作的复杂任务。然而,尽管引入了许多博弈框架,但社区在构建包含 LLMs 和人类-NPC 协作的通用多代理协作基础架构方面仍缺乏足够的基准。
为此,来自微软、加州大学洛杉矶分校,以及斯坦福大学、北京通用人工智能研究院、北京大学、清华大学的研究团队提出了一种新型基础架构--MindAgent,用于评估游戏交互的规划和协调新兴能力。特别是,该基础架构利用现有的游戏框架:1)要求理解多机器人系统的协调者;2)通过未调整的适当指令与人类玩家协作;3)在有反馈的少量提示中建立上下文学习。
此外,该研究还介绍了一种新的游戏场景和相关基准——CUISINEWORLD,可调度多代理协作效率并监督多个代理同时进行游戏。研究团队利用计算协作效率的新自动度量 CoS 进行了全面评估。另外,该基础架构可以在定制的 VR 版 CUISINEWORLD 中部署到现实世界的游戏场景中,并适用于现有的更广泛的 Minecraft 游戏领域。
论文:
MindAgent: Emergent Gaming Interaction
07
综述:AI在Web 3.0中的应用
Web 3.0 是利用分布式技术重构的新一代互联网,其重点是数据所有权和价值表达。同时,它的运行原则是数据和数字资产应由用户而非大公司拥有和控制。
该研究探讨了 Web 3.0 的发展现状以及人工智能(AI)技术在 Web 3.0 中的应用,通过研究 Web 3.0 的现有应用和组件,从生态应用场景的角度提出了 Web 3.0 的架构框架,并将 Web 3.0 的生态勾勒并划分为四个层次:数据管理、价值流通、生态治理和应用场景,并研究深入探讨了每一层中存在的主要挑战和问题。在此背景下,AI 已显示出解决 Web 3.0 现存问题的强大潜力,该研究深入分析了 AI 技术在 Web 3.0 四个层面的应用现状,并对其未来潜在的发展方向提出了一些见解。
论文:
Artificial Intelligence for Web 3.0: A Comprehensive Survey
08
综述:聊天机器人中的偏见与公平
与传统聊天机器人相比,基于大型语言模型(LLMs)的聊天机器人展现出了更强大的能力,并已在现实世界中得到应用。然而,它们的设计存在偏见和公平性问题。由于训练数据量巨大、模型规模超大且缺乏可解释性,它们的偏差缓解和公平性保护工作面临挑战。
因此,该研究对聊天机器人系统中的偏差和公平性进行了全面概述。该研究回顾了聊天机器人的历史及其类别;分析了应用中的偏见来源和潜在危害;研究了设计公平、无偏见的聊天机器人系统的注意事项;并讨论了未来的研究方向。
论文:
Bias and Fairness in Chatbots: An Overview
09
MIT新研究:
拥有世界观的文本到图像生成模型
生成式文本到图像模型(GTI)能根据简短的文字描述生成高质量的图像,并广泛应用于学术和创意领域。然而,GTI 模型经常会放大训练数据中的偏差,往往会生成带有偏见或刻板印象的图像。目前的偏差缓解策略非常有限,主要集中于在不同职业间强制执行性别均等。
为了增强 GTI 偏差缓解能力,该研究提出了 DiffusionWorldViewer,这是一种用于分析和操纵 GTI 模型的态度、价值观、故事和对世界的期望的工具。据介绍,通过基于网络的 GUI 和 Jupyter Notebook 插件部署的交互式界面,DiffusionWorldViewer 对 GTI 生成图像的现有人口统计进行分类,并提供交互式方法,使图像人口统计与用户世界观相一致。
在对 13 位 GTI 用户的研究中,该研究发现 DiffusionWorldViewer 可以让用户表达他们对 GTI 输出公平性的不同观点,并以此挑战当前假定普遍世界观的公平性概念。
论文:
What is a Fair Diffusion Model? Designing Generative Text-To-Image Models to Incorporate Various Worldviews
10
大型语言模型能否
理解现实世界的复杂指令?
大型语言模型(LLMs)可以理解人类指令,但在处理复杂指令时仍有困难,这就使得 LLMs 经常会忽略任务描述中的语义约束,生成错误的格式,违反长度或样本数约束,以及不忠实于输入文本。然而,现有的基准不足以评估 LLMs 理解复杂指令的能力,因为这些指令都是封闭式的、简单的。
为此,该研究提出了 CELLO 基准,用于评估 LLMs 系统地遵循复杂指令的能力。该研究为复杂指令设计了八个特征,并从真实世界的场景中构建了一个全面的评估数据集,还建立了四个标准,并开发了相应的度量方法。通过大量实验,该研究比较了具有代表性的面向中文和面向英文的模型在遵循复杂指令方面的性能。
论文:
Can Large Language Models Understand Real-World Complex Instructions?
11
TextBind:
多轮交错多模态跟读指令
具有指令跟踪能力的大型语言模型(LLMs)通过自然语言界面,在处理各种现实世界任务时显示出了卓越的通用性。然而,它们的性能在很大程度上依赖于高质量的示例数据,而这些数据往往很难获得。当涉及多模态任务时,这一问题更加凸显。
该研究介绍了一种几乎无需注释的框架——TextBind,用于增强 LLMs 的多轮交错多模态指令跟随能力。据介绍,该方法只需要图像-标题对,就能从语言模型生成多轮多模态指令-响应对话。
论文:
TextBind: Multi-turn Interleaved Multimodal Instruction-following

