作者简介
DIDEM GÜRDÜR BROO是瑞典乌普萨拉大学信息技术系的助理教授。她领导网络物理系统实验室,指导以数据为中心的方法和实现的研究,以设计可持续和以人为中心的智能系统,例如协作机器人、自动驾驶汽车和智能城市。在这之前,她曾是斯坦福大学的玛丽·斯克沃多夫斯卡-居里研究员,并在剑桥大学担任研究员。本文选自她在IEEE上发表的一篇分享文章。
原文链接:https://spectrum.ieee.org/ai-design
生成式人工智能如何指导创新设计
2023 年,可能会被称为生成式人工智能元年。生成式人工智能是否会让我们的生活变得更好仍然是一个悬而未决的问题。不过,有一件事是肯定的:新的人工智能工具正在迅速推出,并将持续一段时间。工程师通过对它们进行试验并将其纳入设计过程可以获益匪浅。

这已经在某些领域发生了。阿斯顿·马丁的 DBR22概念车,设计师依靠集成到Divergent Technologies数字 3D 软件中的人工智能来优化后副车架组件的形状和布局。后副车架具有有机骨骼外观,正是通过人工智能对形式的探索实现的,实际部件则通过增材制造生产。
阿斯顿·马丁表示,这种方法大大减轻了部件的重量,同时保持了它们的刚性。该公司计划在即将推出的小批量车型中使用相同的设计和制造工艺。

(NASA 研究工程师 Ryan McClelland 将这些他使用商业人工智能软件设计的 3D 打印组件称为“进化结构”)
人工智能辅助设计的其他例子可以在NASA 的太空硬件中找到,包括行星仪器、太空望远镜和火星样本返回任务。NASA 工程师瑞安表示,人工智能生成的新设计可能“看起来有些陌生和奇怪”,但它们可以承受更高的结构负载,同时重量比传统组件轻。
此外,与传统组件相比,设计时间也只需一小部分。麦克莱兰称这些新设计为“进化结构”。这指的是人工智能软件如何迭代设计突变并收敛于高性能设计。
在此类工程环境中,与生成式人工智能、高质量结构化数据和经过充分研究的参数进行协同设计显然可以带来更具创意和更有效的新设计。
生成式人工智能如何激发工程设计
去年一月,我开始尝试使用生成式人工智能,作为我研究网络物理系统工作的一部分。这类系统有着广泛的应用,包括智能家居和自动驾驶汽车。这些系统依赖于物理和计算组件的集成,通常在组件之间设有反馈回路。
为了开发网络物理系统,设计师和工程师必须协同工作,进行创造性思考。这是一个耗时的过程。我想知道,人工智能生成器是否可以帮助我们扩大设计选项的范围、实现更高效的迭代周期,或促进不同学科之间的协作。
当我开始进行生成式人工智能实验时,我并没有寻找有关设计的具体指导。相反,我更希望获得灵感。最初,我尝试了文本生成器和音乐生成器,只是为了好玩,但我最终发现图像生成器是最合适的。
图像生成器是一种机器学习算法,可以根据一组输入参数或提示创建图像。我测试了许多平台,并努力了解如何在每个平台上形成良好的提示(即生成器用于生成图像的输入文本)。
我尝试过的平台包括 Craiyon、DALL-E 2、Midjourney、NightCafé和Stable Diffusion。我发现Midjourney和Stable Diffusion的组合最适合我的目的。
Midjourney使用专有的机器学习模型,而Stable Diffusion则免费提供了其源代码。Midjourney只能在有互联网连接的情况下使用,并提供不同的订阅计划。您可以在计算机上下载并运行Stable Diffusion并免费使用它,也可以支付象征性的费用在线使用它。我在本地计算机上使用了Stable Diffusion,并订阅了Midjourney。
在我的第一次生成人工智能实验中,我使用图像生成器共同设计了一个自力更生的水母机器人。我们计划在瑞典乌普萨拉大学的实验室中建造这样一个机器人。我们的团队专注于研究受大自然启发的网络物理系统。我们设想水母机器人从海洋中收集微塑料,并成为海洋生态系统的一部分。
在我们的实验室中,我们通常通过迭代过程来设计网络物理系统,包括头脑风暴、草图绘制、计算机建模、模拟、原型构建和测试。我们首先以团队形式开会,根据系统的预期目的和限制提出初步概念。然后我们创建粗略的草图和基本的CAD模型来可视化不同的选项。对最有前途的设计进行模拟以分析动力学并完善机械结构。然后,我们构建简化的原型进行评估,接着再构建更完善的版本。广泛的测试使我们能够改进系统的物理特性和控制系统。这个过程是协作的,但很大程度上依赖于设计师过去的经验。
我想知道使用人工智能图像生成器是否可以开辟我们尚未想象的可能性。我首先尝试了各种提示,从模糊的一句话描述,到长而详细的解释。一开始,我不知道如何提问,甚至不知道该问什么,因为我不熟悉这个工具及其功能。可以理解的是,最初的尝试没有成功,因为我选择的关键词不够具体,而且我没有提供任何有关风格、背景或详细要求的任何信息。

(作者早期尝试生成水母机器人的图像[图1]时,使用了这样的提示:水下、自力更生、迷你机器人、珊瑚礁、生态系统、超现实。作者通过改进提示,得到了更好的结果。对于图 2,她使用了提示:水母机器人,塑料,白色背景。图 3 是根据提示得出的:未来派水母机器人,高细节,生活在水下,自给自足,快速,受自然启发。)

(当作者在提示中添加具体细节时,她得到的图像更符合她对水母机器人的想象。图 4、5、6 均来自提示:未来电动水母机器人,设计为自给自足,生活在海底、水或弹性玻璃状材料、变形器、技术设计、透视工业设计、复印风格,电影般的高细节,超详细,喜怒无常的分级,白色背景。)
当我尝试给出更精确的提示时,设计开始与我的愿景更加同步。然后我尝试了不同的纹理和材料,直到我对其中的几种设计感到满意为止。
几分钟内看到我最初的提示结果真是令人兴奋。但要花费几个小时才能做出改变、重申概念、尝试新的提示并将成功的元素结合到最终的设计中。
与人工智能共同设计是一次启发性的经历。提示可以涵盖许多属性,包括主题、媒介、环境、颜色,甚至情绪。我了解到,一个好的提示需要具体,因为我希望设计能够服务于特定的目的。另一方面,我希望对结果感到惊讶。我发现我需要在我知道和想要的东西,与我不知道或无法想象但可能想要的东西之间取得平衡。我了解到,提示中未指定的任何内容都可能由AI平台随机分配给图像,如果您希望结果中包含特定的内容,那么您必须将其包含在提示中,并且您必须清楚对您重要的任何上下文或细节。您还可以包含有关图像组成的说明,这对您设计工程产品时非常有帮助。
控制生成人工智能的结果几乎是不可能的
作为调查的一部分,我试图看看我能在多大程度上控制共同创造过程。有时它有效,但大多数时候它失败了。

(为了生成人形机器人的图像[左],作者从简单的提示开始:人形机器人,白色背景。然后,她尝试将眼睛摄像头融入人形设计中[右],使用以下提示:具有摄像头眼睛的人形机器人,技术设计,添加文本,全身视角,强壮的手臂,V形身体,电影高细节,光线背景。)
上面的人形机器人设计中出现的文字并不是实际的文字,只是图像生成器生成的字母和符号,作为技术绘图美学的一部分。当我提示人工智能进行“技术设计”时,它经常包含这种伪语言,可能是因为训练数据包含许多具有相似文本的技术图纸和蓝图示例。这些字母只是算法与技术插图风格相关联的视觉元素。因此,人工智能正在遵循它在数据中识别的模式,即使文本本身是无意义的。这是一个无害的例子,说明这些生成器如何在没有任何真正理解的情况下采用训练中的怪癖或偏见。
当我试图将水母变成章鱼时,它惨遭失败——这令人惊讶,对于工程师来说,水母和章鱼看起来非常相似。为什么该发生器对水母产生了良好的结果,但对章鱼产生了僵化、外星人般的和解剖学上不正确的设计,这是一个谜。再次,我假设这与训练数据集有关。

(作者使用此提示生成了类似章鱼的机器人的图像:未来电动章鱼机器人、技术设计、透视工业设计、复印风格、电影高细节、喜怒无常的分级、白色背景。底部的两张图片是在顶部图片几个月后创建的,看起来稍微不那么粗糙,但仍然不像章鱼。)
在使用人工智能图像生成器制作了几个有前途的水母机器人设计后,我与我的团队一起审查了它们,以确定是否有任何方面可以为真实原型的开发提供信息。我们讨论了哪些美学和功能元素可以很好地转化为物理模型。例如,许多图像中的弧形伞形顶部可以启发机器人保护外壳的材料选择。流动的触手可以为实现与海洋环境相互作用的灵活机械手提供设计线索。看到人工智能生成的图像中不同的材料和构图以及抽象的艺术风格,鼓励我们对机器人的整体形式和运动进行更多异想天开和创造性的思考。
虽然我们最终决定不直接复制任何设计,但人工智能艺术中的有机形状激发了有用的想法以及进一步的研究和探索。这是一个重要的结果,因为正如任何工程设计师都知道的那样,在进行足够的探索之前就开始实施一些东西是很诱人的。
例如,即使是奇特的或不切实际的计算机生成概念也可以通过充当粗略原型来使早期工程设计受益。设计公司IDEO的首席执行官蒂姆·布朗指出,此类原型“会减慢我们的速度,从而加快我们的速度。通过花时间对我们的想法进行原型设计,我们可以避免代价高昂的错误,例如过早变得过于复杂以及长期坚持一个薄弱的想法。”
即使生成式人工智能不成功的结果也可能具有启发性
还有一次,我使用图像生成器来尝试说明智慧城市中通信的复杂性。
通常,我会开始在白板上创建此类图表,然后使用绘图软件(例如Microsoft Visio、Adobe Illustrator 或 Adobe Photoshop)重新创建绘图。我可能会寻找现有的库,其中包含我想要包含的组件的草图——车辆、建筑物、交通摄像头、城市基础设施、传感器、数据库。然后我会添加箭头来显示这些元素之间的潜在连接和数据流。
例如,在智慧城市插图中,箭头可以显示交通摄像头如何将实时数据发送到云端并计算与拥堵相关的参数,然后将其发送到联网汽车以优化路线。开发这些图表需要仔细考虑正在发挥作用的不同系统以及需要传达的信息。这是一个专注于清晰沟通的有意过程,而不是一个可以自由探索不同视觉风格的过程。

(作者尝试使用图像生成器来显示智慧城市中复杂的信息流,基于这样的提示:该图显示了智慧城市中不同组件之间通信的复杂性,白色背景,干净的设计。)
我发现在使用人工智能图像生成器时,相较于绘图软件,提供了更多的创作自由,但它们并不能准确地描绘智慧城市中复杂的互联。尽管上面的成果有效地体现了许多独立的元素,但是它们在展现信息流和交互方面并不理想。图像生成器无法理解上下文或是表示之间的关联。
在几个月的使用图像生成器并将其发挥到极限之后,我得出的结论是,它们对于探索、激发灵感以及生成快速插图以在头脑风暴会议中与同事分享非常有用。即使图像本身并不现实或不可行的设计,它们也会促使我们想象我们可能不会考虑的新方向。即使那些不能准确传达信息流的图像,它们也会有助于推动富有成效的头脑风暴。
我也了解到,与生成式人工智能共同创造的过程,需要一定的毅力和奉献精神。虽然快速获得良好结果是值得的,但如果有特定的议程并寻求特定的结果,这些工具就变得难以管理。但是,人类用户对人工智能生成的迭代几乎没有控制权,且结果也是不可预测的。
当然,你可以继续迭代,希望能得到更好的结果。但目前,几乎不可能控制迭代的结束位置。我不会说共同创造过程纯粹是由人类领导的——或者至少不是一个人。
我注意到我自己的思维、我表达想法的方式,甚至我对结果的看法在整个过程中发生了怎样的变化。很多时候,我在开始设计过程时都会考虑到特定的功能,例如特定的背景或材料。经过一些迭代后,我发现自己选择了基于视觉特征和材料的设计,而这些设计是我在第一次提示中未指定的。在某些情况下,我的特定提示不起作用;相反,我必须使用增加人工智能艺术自由度并降低其他规范重要性的参数。因此,这个过程不仅允许我改变设计过程的结果,而且还允许人工智能改变设计,也许还有我的想法。
自从我开始实验以来,我使用的图像生成器已经更新了很多次,我发现新版本使结果更加可预测。虽然如果你的主要目的是看到非常规的设计概念,可预测性是负面的,但我可以理解在使用人工智能时需要更多的控制。我认为将来我们将看到在明确定义的约束下可以相当可预测地执行的工具。更重要的是,我希望看到图像生成器与许多工程工具集成,并看到人们使用这些工具生成的数据进行培训。
当然,人工智能图像生成器的使用也会引发严重的道德问题。有严重的放大训练数据中的人口统计和其他偏见的的风险。生成的内容可能会传播错误信息并侵犯隐私和知识产权。人们对人工智能生成器对艺术家和作家生计的影响存在许多合理的担忧。显然,数据源、内容生成和下游使用需要透明度、监督和问责。我相信任何选择使用生成式人工智能的人都必须认真对待这些问题并合乎道德地使用生成器。
如果我们能够确保生成式人工智能的使用符合道德规范,那么我相信这些工具可以为工程师提供很多帮助。与图像生成器的共同创建可以帮助我们探索未来系统的设计。这些工具可以改变我们的思维方式,让我们走出舒适区——这是在严格的工程设计强加秩序之前制造一点混乱的一种方式。通过利用人工智能的力量,我们工程师可以开始以不同的方式思考,更清楚地看到联系,考虑未来的影响,并设计创新和可持续的解决方案,以改善世界各地人们的生活。

