ChatGPT的5个致命缺点，与解决方法- 大数跨境

AIGC开放社区

2023-04-10

导读：本文将主要讨论大语言模型的主要问题，以及产生的原因和解决思路。

专注AIGC领域的专业社区，关注GPT-4、百度文心一言、华为盘古等大语言模型（LLM）的发展和应用落地，以及国内LLM的发展和市场研究，欢迎关注！

本文聚焦大语言模型存在的主要问题、成因及应对思路。当前以ChatGPT为代表的大模型虽表现惊艳，但仍存在认知偏差与事实错误，需理性评估其能力边界，避免过度依赖。

大语言模型的六大核心问题

ChatGPT不依赖实时网络检索，知识完全来自训练数据。这意味着它无法获取2021年9月之后的信息，也无法验证信息的真实性。其回答基于词语共现概率生成，本质上是“有逻辑的猜测”，可能导致答案看似合理却严重失实。

大模型难以掌握企业制度、文化氛围或个人背景等深层语境。在实际应用中，若无法融入具体场景的上下文，输出内容将难以满足个性化或专业化需求。这一瓶颈需通过多模态学习与定制化训练逐步突破。

由于训练数据截止于2021年，模型对新事件、科技进展或政策变化缺乏认知。更严重的是，它可能虚构信息并自信输出，形成“AI幻觉”。此类问题在医疗、法律等高风险领域尤为危险。

训练数据中隐含的社会偏见可能被模型放大，导致性别、种族或群体歧视性回应。早期版本曾出现侮辱用户、情绪化攻击等异常行为，反映出模型在价值观对齐方面的不足。

黑客已利用ChatGPT生成诈骗话术、情感操控剧本乃至恶意代码。通过API绕开安全限制，将其包装为“虚拟人格”实施社交工程攻击，凸显出模型滥用的风险。

包括单次对话长度限制、响应延迟、计算资源消耗大等问题，短期内受制于算力成本。长期来看，数据隐私、知识产权归属、法律责任界定等议题仍待系统性解决。

技术分析师本尼迪克特·埃文斯指出，ChatGPT“擅长写出极具说服力的废话”，一旦整合进搜索引擎，可能大规模传播看似权威的虚假信息。

深度学习先驱Yann LeCun强调，大模型缺乏对现实世界的非语言认知。“它们不懂语言背后的物理现实”，生成文本仅追求统计一致性，而非真实理解。人类大量知识源于观察与经验，而当前AI不具备这种学习机制。

LeCun认为，语言建立在“常识”基础上，而常识来源于现实互动。另一位专家杰夫·辛顿也指出，许多技能如投篮靠实践而非语言习得，说明非语言学习至关重要。

“AI幻觉”指模型生成虚假但流畅的内容。主要原因有两个：

一是训练数据本身包含错误或片面信息，模型将其内化为参数知识，导致知识不全、不新；二是推理过程中为提升表达连贯性，模型主动“补全”逻辑链条，造成为回答而编造的现象。

业界普遍采用RLHF（基于人类反馈的强化学习）优化模型输出。该方法通过持续的人工标注与反馈，引导模型识别并修正错误，逐步调整其生成策略。

不完整或模糊的信息：人与AI都倾向于填补信息空白，应通过追问澄清减少误判。

确认偏误：避免只接受符合预设的观点，需主动寻求反例与多元视角。

过度概括：警惕经验泛化，注重具体情境差异。

模式识别偏差：防止虚构关联，需审慎评估证据强度。

上下文影响：意识到信息呈现方式对判断的干扰，提升元认知能力。

OpenAI首席科学家Ilya Sutskever认为，通过高效的人类反馈机制，“教会模型不要胡说”是可行路径。GPT-4已在准确性方面显著改进，证明RLHF方向正确且仍有发展空间。

可将当前大语言模型比作一个5个月大的“孩子”。我们无法改变其基础架构，但可通过持续教育（如RLHF）引导其成长。就像四岁儿童能流利表达却常夹杂虚构情节，ChatGPT的语言能力远超认知水平。

将其视为9岁孩童更为合理——不应苛求其解答哲学难题或解决复杂产业协作。过度干预或错误引导可能抑制创造力，甚至训练出“认知扭曲”的模型。若全球仅由单一机构主导训练，亦存在系统性风险。

【声明】内容源于网络

AIGC开放社区

1234

内容 1677

粉丝 0

AIGC开放社区 1234

总阅读16.8k

粉丝0

内容1.7k