1. 巧用三种模式
DeepSeek 提供基础模型、深度思考 (R1) 和联网搜索三种模式,分别适用于不同场景:
基础模型:适用于大多数日常需求,性能比肩全球顶尖模型。
深度思考 (R1): 擅长处理数理逻辑、代码和复杂问题,适合深度推理任务。联网搜索:结合网络搜索结果回答问题,适用于知识库截止日期之后的问题。
2. 模型性能对比
V3 模型:采用 Moe 架构,618B 参数,擅长百科知识,回答速度快。
R1 模型:采用后训练 + RL 学习技术,660B 参数,擅长逻辑推理,回答速度较慢。
联网搜索:通常不与深度思考同时使用,以免影响智能表现。
3. 知识更新至 2024 年 7 月
DeepSeek 的预训练数据更新至 2024 年 7 月,对于此日期之前的问题,通常无需开启联网功能;对于之后的问题,建议开启联网功能以获得更佳效果。
4. 提示词核心:准确表达
DeepSeek 对提示词要求不高,关键在于准确表达需求。通用提示词模板包括 “你是谁 + 你的目标”,并可根据需要补充背景信息。
5. 与 DeepSeek 沟通,尽量说人话与 DeepSeek 沟通时,使用直白、俗气的语言更能激发其潜能,例如模仿特定人物风格写作。
6. 我是一名小学生
为避免 R1 生成内容过于结构化和死板,可提示 DeepSeek 使用适合特定年龄段的语言,如 “请用小学生能听懂的话解释”。
7. 活用联网搜索
DeepSeek 支持推理 + 联网搜索,可处理知识库截止日期之后的问题,例如根据最新事件创作故事。
8. 活用上传附件
DeepSeek 支持上传附件 (最多 50 个,每个不超过 100MB),可基于自有知识库进行推理、思考,适用于本地化、私密需求。
9. 活用 V3+R1
可将 V3 模型和 R1 模型结合使用,先用 V3 获取细节和提示词,再用 R1 进行深度推理和输出,提升模型能力。
10.R1 的三个开放
DeepSeek 对 R1 模型实现了三个开放:
思维链全开放:可查看完整、透明的思考过程。
训练技术全部公开:采用 RL 强化学习技术,提升推理能力。
开源 2+6 个模型:提供不同参数规模的模型,最小 1.5B 参数,10G 显存可运行。
-
有效提问的五个黄金法则
法则一:明确需求 错误示例:[帮我写点东西] 正确姿势:[我需要一封求职信,应聘新媒体运营岗位,强调 3 年公众号运营经验]
法则二:提供背景
错误示例:[分析这个数据]
正确姿势:[这是一家奶茶店过去三个月的销售数据,请分析周末和工作日的销量差异 (附 CSV 数据)]
法则三:指定格式
错误示例:[给几个营销方案]
正确姿势:[请用表格形式列出三种情人节咖啡店促销方案,包含成本预估和预期效果]
法则四:控制长度
错误示例:[详细说明]
正确姿势:[请用 200 字以内解释区块链技术,让完全不懂技术的老人能听懂]
法则五:及时纠正
当回答不满意时,比如:
-
[这个方案成本太高,请提供预算控制在 500 元以内的版本。]
-
[请用更正式的语气重写第二段]
-
续写:当回答中断时自动继续生成 -
简化:将复杂内容转换成大白话 -
示例:要求展示实际案例 (特别是写代码时) -
步骤指导:让 AI 分步指导操作流程 -
检查:帮你发现文档中的错误
场景演练:
-
输入 [步骤:如何用手机拍摄美食照片],观察分步指导 -
输入 [请解释量子计算,然后 / 简化],对比前后差异
最后附上一份官方提示示例库,覆盖了代码处理、创意写作、语言翻译、数据结构化、角色交互等多样化场景,适用于开发者、内容创作者、教育工作者等群体。
https://api-docs.deepseek.com/zh-cn/prompt-library/

