大数跨境
0
0

有经验的 ChatGPT 用户的 4 种人机交互模式

有经验的 ChatGPT 用户的 4 种人机交互模式 七元宇宙
2024-04-22
0
导读:自 ChatGPT 问世以来已经一年半了,但只有少数人以 30%+ 的功率使用此类 AI 聊天机器人。

ChatGPT 问世以来已经一年半了,但只有少数人以 30%+ 的功率使用此类 AI 聊天机器人。大多数人都不知道生成式人工智能的“特征”,如翻转交互、基于标准的自我评估以及与人类共同制定任务。因此,他们花费大量时间来制定 AI 任务并分析 AI 输出的许多修订版,但仍然得到比他们预期更糟糕的结果。让我们弄清楚如何解决它。

介绍

作为当地“AI in Management”社区的活跃成员,我经常看到即使是 ChatGPT 和其他 GenAI 助手的经验丰富的用户也从传统的人机对话方式出发。他们假设他们必须编写完整的指令,而人工智能只需要遵循他们的指令。

实际上,人工智能聊天机器人仅被视为回答我们的问题、根据我们的提示生成文本或处理我们的数据的工具。如果聊天机器人无法提供令人满意的输出,要么我们需要更好地指导它,要么干脆不做它。如果我们没有时间详细描述任务,或者我们自己还没有完全实现任务,我们也没有人工智能。

然而,这种传统观点极大地限制了生成式人工智能的范围和价值。事实上,大型语言模型 (LLM) 可以以各种角色与我们互动,而不仅仅是响应请求或遵循指令。此外,我们并不总是需要更好地指导或“训练”他们以获得更好的输出。

通过应用 任务执行者或专家以外的 AI 角色,我们可以扩大 AI 可以帮助解决的问题范围,实现更高质量的结果,并减少编写指令的认知负荷。使用不同的角色可以释放 AI 作为合作伙伴的真正潜力。

为简单起见,我将非常规 AI 角色分为 4 种人类与 AI 交互模式,这就是为什么本文有 4 个部分。然而,这只是我个人的简化。我的主要想法不是关于特定的角色,而是关于扩展人类与人工智能交互的标准“请求-响应”模型。

1. 翻转交互策略

在人工智能角色领域,第一个不明显的模式是“翻转交互”,人工智能通过提出问题来带头。

该研究论文[1]在提示工程的背景下研究了翻转交互模式,以及其他技术,如定义聊天机器人的角色(角色模式)和指定输出格式(模板模式)。翻转交互模式在较短的博客文章中也被描述为一种提示技术。

但是,我认为翻转交互模式和类似的认知验证者模式属于更高层次的“策略”。在制作提示之前,甚至在完成手头的任务之前,都应该仔细考虑它们。采用这种策略可以塑造您与 AI 交互的许多其他方面。

原因

通常,这种方法减少了人类所需的时间和认知工作量,完全符合典型 AI 用户的目标。同样,典型的互联网用户喜欢拥有内容或产品建议,无需自己表达查询。

使用案例

  • 例如,人工智能聊天机器人通常被用作导师。这样的导师的一半好处不在于它提供的建议(根据我的经验,这些建议往往过于笼统且不可操作),而是它能够提出发人深省的问题,刺激用户找到解决问题的方法。
  • 人工智能教练的角色也是如此,他会提出“强大”的开放式问题,以帮助用户识别他们的问题和挑战。
  • 或者看看个性化 AI 导师的角色,它主要专注于识别用户知识和技能方面的差距(提出问题),以填补这些差距。
  • 同样,好友的角色也假设 AI 会提出问题。这种问题使一个人更容易找到实现任何目标的动力。

实现示例

例如,如果你想和人工智能导师一起快速掌握一个广泛的主题,你可以从请求“问我N个关于<主题>的开放式问题,以了解我目前的理解水平”。然后,要求对你的答案进行评估,并提出新的问题,重点关注你所确定的最薄弱的领域。

这导致了具有快速反馈的自适应学习。它还包括对您的教育需求进行透明的优先级排序,这与传统的自适应学习系统不同,在传统的自适应学习系统中,优先级对学习者来说是不透明的。

可以在此处找到与 GPT-4 的聊天示例。在这个例子中,一个主题是在实践中学习的,所以ChatGPT给用户的是作业而不是问题。

2. 协作任务定义和情境增强

我还认为,当人工智能聊天机器人提出问题时,翻转交互是实现完全不同目标的工具。使用 AI 进行 QA 会话的目标是快速形成与任务相关的上下文,这对于进一步使用聊天机器人作为响应者/执行者的传统角色至关重要。

原因

至少,这种方法可以帮助你克服“空白页”问题,这是面对复杂任务时拖延的主要原因。当您要求聊天机器人解决您以前从未解决过的问题时,这个问题尤其会出现。

人们认为(以上面的帖子为例)快速将草稿任务编写到 AI 可以帮助解决空白页问题。它可以提供帮助,但是应该彻底检查这种草稿任务的 AI 输出,并且由于质量差,大部分总是被丢弃。

对于同一个问题,更好的解决方案是先从聊天机器人中获取问题,然后再生成输出。原因是与从头开始描述任务相比,选择问题并回答问题对我们来说要容易得多。

迭代提问的第二个优点是高质量的结果。结果取决于您的具体情况,而不仅仅是类似问题的通用解决方案。解决任务的整个途径可以围绕人工智能提出问题来构建。您回复他们并根据您的回复收到进一步的问题。这种情况一直持续到你告诉机器人一个短语,比如“现在,<建议一个完整的解决方案>,考虑到上述所有因素”。

使用案例

  • 如果您很少处理此类任务或不熟悉该主题,则可能缺乏正确的词语和对任务的整体理解。然后,提示 AI 为您推荐详细任务的几个版本,选择适合您需求的版本,然后您可以希望获得高质量的结果。否则,适用“垃圾进,垃圾出”的原则。
  • 如果您是手头任务领域的专家,那么您可能需要降低几个级别并了解“通用助手”缺乏什么上下文来产生您期望的输出。让它告诉你它自己的需求!

实现示例

上下文形成问题的一个特殊情况是,当您尚未完全掌握任务时,用于澄清任务的问题。最初,您可能会请求类似“建议与...相关的任务公式”,然后选择最符合您需求的公式并说“问我问题以进一步阐明此任务”(类似于文章[1]中讨论的问题细化模式和认知验证器模式)。然后,你回答一些人工智能问题,故意忽略其他问题。忽略对于创建与任务相关的重点上下文也很重要。

当我说“选择<某些项目>”或“回答<一些问题>”时,我的意思是只使用列表项的数量。所有最先进的 LLM 都很好地理解这些数字,并且在节省时间方面非常方便。

举个具体的例子,让我们考虑一下准备与候选人进行行为面试的目标。对于人工智能来说,这不是一件容易的事:
  • 新手用户可能会要求人工智能根据关于空缺的几句话来制定面试问题,结果很可能不尽如人意。
  • 有经验的用户将向人工智能提供尽可能多的相关信息,例如职位描述文件和/或职责清单。然而,即使在这种情况下,结果往往过于笼统。大型语言模型 (LLM) 将表达得很漂亮,但从本质上讲,它只是将所提供文档中的单词合并到模型训练的标准“面试模板”中。该模型从未执行过相关工作,因此它无法从本质上理解职位描述中特别重要的内容。此外,它无法知道哪些候选特征对您特别重要(因为文档中没有此类信息)。
因此,我们应该要求人工智能提出澄清问题。我会指示如下:
  1. 从职位描述中提取上述目的所需的信息(见附件)。
  2. 问我几个问题,以了解这份工作的独特之处和我的个人喜好。确保问题具体且与文档一致。问题清单应编号。
  3. 根据我的回答,确保您深入了解这份工作和我的偏好。忽略任何我认为无关紧要的方面。然后,撰写涵盖前面强调的所有要点的面试问题。
您可以在此处找到遵循此示例的 GPT-4 聊天。

如何避免混淆人工智能?

您可以通过要求对特定问题进行进一步澄清来继续上述过程。但是,请尽量避免冗长和“为了问题而提问”,因为目标不仅是帮助您理解任务,而且还要有效地引导 AI 实现任务解决方案。上下文中过多的词语可能会在以后混淆 LLM,导致它偏离你的预期方向 [4]。
为了减少 AI 混淆的可能性,您可以在解决任务之前说:“现在,考虑到上述所有因素,对我的任务进行完整的表述”,而不是立即请求解决方案。此技术很有帮助,原因有二:
  • 上下文中的最后一条消息成为完整的任务,而聊天机器人的算法认为最近的消息很重要,该算法为 LLM 准备上下文。LLM 不会像对待“注意力”那样平等地对待上下文的所有部分。
  • 如果建议的任务描述中有不正确的地方,最好在最后一步之前进行更正。

如何进一步减少您的工作量?

我相信你可以在实践中找到其他案例,在这些案例中,翻转交互可能对你特别有用。这种策略既可以用于情境形成,也可以用于质疑本身的行为(人工智能作为教练、伙伴、导师或老师)。
然而,如果你经常翻转与人工智能的互动,你最终可能会厌倦让聊天机器人在几乎每一步都提出问题。因此,您可以要求 AI 只执行此操作一次。为了可靠性,最好在所谓的“系统提示”中询问它。
  • 如果您使用的是 ChatGPT Plus,则应用系统提示需要创建您自己的 GPT 并在“说明”字段中输入提示。然后,它将与用户请求和助手的响应分开传递给 LLM。
  • 另一种制作系统提示的方法不需要像 ChatGPT Plus 这样昂贵的订阅。每个领先的 LLM 提供商都提供了另一种工具,比 ChatGPT 或 Claude.ai 或 Google AI Studio 具有更多控制权。OpenAI 有 Playground,Anthropic 有 Console,这两个工具都可以让您设置系统提示、选择 LLM 版本、分配温度和其他参数。它比订阅需要更少的钱。此外,Anthropic 为新用户提供免费的 5 美元积分。
下面是系统提示的示例短语:“如果用户请求了某些内容(提出问题、给出指令等),那么您必须建议请求的更好版本(可能导致更具体输出的详细版本),并询问用户是否愿意使用您的版本。这句话是一种问题细化模式的实现。

3. 基于人类角色的人工智能交互

检查您在“客户-执行者”模型之外如何与其他人互动。交互不必翻转。我的意思是,主动性和问题不一定来自聊天机器人。事实上,前面提到的“导师-学员”和“师-生”模式不仅仅是关于前者的问题。
以下是您和 AI 之间其他一些可能的交互模型:

人工智能作为你的下属:定期批准和纠正

这种人际关系不一定是老板下达指令,下属一言不发地执行。例如,下属经常将自己的想法、详细计划和初步结果提交给上级批准。
这样,经理们只需在工作流程的某些阶段就参与其中,无论是准备季度报告、开发新产品,还是制定新战略,都可以节省时间。然而,他们把握着脉搏并反复参与,因为不可能事先预测所有事情或解决所有细节。在工作期间,外部环境可能会发生变化,员工可能会错过导致重新计划的最后期限,等等。
同样,您可以将自己视为“AI 机器人管理器”,例如:
  1. 让 AI 为你起草一个提示,批评它,然后才请求它执行。
  2. 对于大多数实际任务,单个提示是不够的。该任务应分解为几个相互关联的子任务。因此,请求 AI 执行此分解。
  3. 明确地向 AI 定义您的角色:您是经理,是具有特定能力的员工。告知 AI,它的任务是发送每个中间结果供您批准:想法列表、实施计划、文本的第一部分(如果目标是编写文本)以及所有其他工件。
  4. 最重要的是,给人工智能一些小而具体的指令,就好像是你的新下属还不熟悉你的喜好和期望一样。例如,如果存在您修改的文本的第一部分,则指示 AI 使用第一部分作为样式和术语方面的模型来编写第二部分(而不是一次编写整个文本)。
为什么它很重要?通过小步前进,您将更快地达到预期的结果。
我的意思是,与最初详细描述任务然后批评最终结果相比,这种方法更快。如果管理者以这种方式运作,他们将浪费大量时间,更重要的是,在员工执行不必要的工作(不符合客户需求或质量要求的结果)上浪费大量资金。

AI 作为您的合著者:导航共同创作过程

想象一下,你想写一个大文本,比如年度报告或博客文章。您可以在互联网上找到许多提示示例,它们包括数十个句子和部分,例如目标、模板、指南和文本风格。或者,您可以考虑向 AI 提供您认为可以作为任务典范的类似文本的示例。它被称为 few-shot 提示。
一般来说,这两种方法都被证明是有效的,特别是如果编写这样的文本对你来说是一项例行任务。在这种情况下,您已经熟悉必要的文本模板和样式,并且您知道要避免的潜在陷阱。
但是,如果您没有示例并且第一次处理此类任务怎么办?然后,我的建议是不同的:将人工智能视为合著者。参与协作编辑的多次迭代,作为平等的合作伙伴与 AI 合作。
在这种情况下,替代方案更糟。主要将 AI 视为主要作者,而将您自己视为客户、评论家或编辑,可能会:
  • 导致即使经过多次迭代,也对结果不满意;
  • 只给你做技术修正的平凡任务,而人工智能则处理工作的所有创造性方面。
你如何实现这一点?
首先,采用前面提到的“经理-下属”模型的技术(见上文第 2-4 项)。这包括在 AI 的帮助下将任务分解为子任务,要求显示中期结果,以及使用您编辑的版本作为新部分的模板。
其次,让你与人工智能的交流更加对称,使用诸如“让我们讨论<问题/想法/解决方案>”或“让我们一起解决这个问题,轮流提出更改建议,直到我说'完成'”之类的短语。
例如,让我们看一下子任务创建的阶段。当从 AI 收到子任务列表的第一个版本时,重写需要澄清的项目(模糊的项目是最常见的问题)。然后,向 AI 提供修改后的列表,指定应删除哪些项目,并考虑这些调整要求提供新版本的列表。

4. 合作成果的质量标准和评估

早些时候,我讨论了实现“质量”结果的目标,现在必须定义“质量”在这种情况下的含义。我的建议是在与人工智能的对话中明确定义质量标准。
通过在一开始就引入标准,您可以看到 AI 在其初稿中是否遵守了这些标准。然而,我们往往很难事先了解我们的标准。因此,在查看第一个修订版后定义它们并没有错。
如果在指定标准后结果仍然不足,您可以通过指出最新版本未能满足的标准来快速指导聊天机器人。让我们举个例子,当标准列表包括对每个陈述的解释(第 2 项)和对所需业务风格的遵守(第 4 项)时。然后,您可以请求:“根据标准 2 和 4 改进文本。人工智能会理解你,准确地增强你需要的东西。
实施这些标准可以显著减少实现满足所有需求的结果所需的迭代次数。与简单地告诉 AI “我不满意”或给出“3 分(满分 10 分)”这样的总体评分相比,这种方法更有效,这可能会导致 AI 反复尝试和道歉。
生成式人工智能还有一个不太明显的功能。
在请求新修订之前,您可以根据特定标准对当前输出进行定量评估。你可以自己做,但让人工智能给自己打分更容易。有一个术语:模型分级评估。但是,我不会高估法学硕士进行准确定量评估的能力。
如有必要,您还可以请求 AI 计算所有标准的平均分数。我已经用 ChatGPT 尝试过这个,它激活了它的分析功能并准确地计算了算术平均值。
最后,可能会出现一个问题:“我们实际上从哪里获得质量标准?你应该总是自己详细描述它们吗?第三个能力是人工智能擅长制定标准。当然,人工智能可以从一般考虑中生成许多不相关的点,但您可以轻松地只选择对您重要的点。此外,你可以要求 AI 通过向它提供诸如“如果......”和“对......施加惩罚”等示例来指定这些标准。
一般来说,将 AI 视为您的合著者(同事),不仅在共同解决任务方面,而且在共同思考如何增强解决方案方面。特别是,从基于标准的评估的角度考虑改进,可以提高质量并减少工作量。

结论

生成式 AI 聊天机器人的应用可以显着扩展,不仅将它们视为明确定义任务的执行者,还可以将其视为各种其他角色:
  1. 作为教练、伙伴、导师或老师——如果问题本身很重要。
  2. 作为帮助您阐明任务的对话伙伴——如果您还不清楚任务,如果您对该主题的了解有限,或者您由于“空白页问题”而拖延。
  3. 作为下属,为您带来想法、计划和中期结果以供批准。
  4. 作为合著者,您可以与他平等地工作,并通过使用更正的部分作为下一部分的模板进行少量迭代来获得高质量的结果。
  5. 作为评估员,协助您定义质量标准并根据这些标准评估结果。
如果你准备好改变你的思维方式,通过接受这些不那么明显的角色和模式来重新思考你与人工智能的互动,那么你将获得几个好处:
  • 你确实实现了你的目标,因为人工智能可以帮助你思考。
  • 它不会夺走你最引人入胜的创意作品。
  • 您可以减少获得高质量结果的努力。
  • 您可以降低无法达到所需质量级别的风险。
还有更多方法可以利用生成式人工智能,而不仅仅是将其视为任务的执行者和问题的响应者。研究论文(例如,[6])提供了包含大量人类-人工智能交互模式的框架和分类法。在我看来,通过思考人工智能角色而不是依赖这些分类法,可以更容易地理解这些模式的实际应用。

关注我,一起探索元宇宙!
免责声明:
以上发布内容和图片的目的在于传播更多行业信息,版权归原作者所有,不为商业用途,如有侵犯,敬请与我们联系。


【声明】内容源于网络
0
0
七元宇宙
AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
内容 3217
粉丝 0
七元宇宙 AI、Web3、Meta聚合型精选内容分享。以前沿视角,探索科技未来;让每一个人,都走在时代的前沿
总阅读75
粉丝0
内容3.2k