大数跨境
0
0

DeepSeek:基础对话篇(像交朋友一样学交流)

DeepSeek:基础对话篇(像交朋友一样学交流) 二进制跳动
2025-02-12
0
导读:DeepSeek:基础对话篇(像交朋友一样学交流)


1. 巧用三种模式

DeepSeek 提供基础模型、深度思考 (R1) 和联网搜索三种模式,分别适用于不同场景:

基础模型:适用于大多数日常需求,性能比肩全球顶尖模型。

深度思考 (R1): 擅长处理数理逻辑、代码和复杂问题,适合深度推理任务。联网搜索:结合网络搜索结果回答问题,适用于知识库截止日期之后的问题。

2. 模型性能对比

V3 模型:采用 Moe 架构,618B 参数,擅长百科知识,回答速度快。

R1 模型:采用后训练 + RL 学习技术,660B 参数,擅长逻辑推理,回答速度较慢。

联网搜索:通常不与深度思考同时使用,以免影响智能表现。

3. 知识更新至 2024 年 7 月

DeepSeek 的预训练数据更新至 2024 年 7 月,对于此日期之前的问题,通常无需开启联网功能;对于之后的问题,建议开启联网功能以获得更佳效果。

4. 提示词核心:准确表达

DeepSeek 对提示词要求不高,关键在于准确表达需求。通用提示词模板包括 “你是谁 + 你的目标”,并可根据需要补充背景信息。

5. 与 DeepSeek 沟通,尽量说人话与 DeepSeek 沟通时,使用直白、俗气的语言更能激发其潜能,例如模仿特定人物风格写作。

6. 我是一名小学生

为避免 R1 生成内容过于结构化和死板,可提示 DeepSeek 使用适合特定年龄段的语言,如 “请用小学生能听懂的话解释”。

7. 活用联网搜索

DeepSeek 支持推理 + 联网搜索,可处理知识库截止日期之后的问题,例如根据最新事件创作故事。

8. 活用上传附件

DeepSeek 支持上传附件 (最多 50 个,每个不超过 100MB),可基于自有知识库进行推理、思考,适用于本地化、私密需求。

9. 活用 V3+R1

可将 V3 模型和 R1 模型结合使用,先用 V3 获取细节和提示词,再用 R1 进行深度推理和输出,提升模型能力。

10.R1 的三个开放

DeepSeek 对 R1 模型实现了三个开放:

思维链全开放:可查看完整、透明的思考过程。

训练技术全部公开:采用 RL 强化学习技术,提升推理能力。

开源 2+6 个模型:提供不同参数规模的模型,最小 1.5B 参数,10G 显存可运行。

  1. 有效提问的五个黄金法则

    法则一:明确需求
    错误示例:[帮我写点东西]
    正确姿势:[我需要一封求职信,应聘新媒体运营岗位,强调 3 年公众号运营经验]

   法则二:提供背景

  错误示例:[分析这个数据]

正确姿势:[这是一家奶茶店过去三个月的销售数据,请分析周末和工作日的销量差异 (附 CSV 数据)]

法则三:指定格式

错误示例:[给几个营销方案]

正确姿势:[请用表格形式列出三种情人节咖啡店促销方案,包含成本预估和预期效果]

法则四:控制长度

错误示例:[详细说明]

正确姿势:[请用 200 字以内解释区块链技术,让完全不懂技术的老人能听懂]

法则五:及时纠正

当回答不满意时,比如:

  • [这个方案成本太高,请提供预算控制在 500 元以内的版本。]

  • [请用更正式的语气重写第二段]

新手必学的 10 个魔法指令基础指令集:
  1. 续写:当回答中断时自动继续生成
  2. 简化:将复杂内容转换成大白话
  3. 示例:要求展示实际案例 (特别是写代码时)
  4. 步骤指导:让 AI 分步指导操作流程
  5. 检查:帮你发现文档中的错误


场景演练:

  1. 输入 [步骤:如何用手机拍摄美食照片],观察分步指导
  2. 输入 [请解释量子计算,然后 / 简化],对比前后差异

最后附上一份官方提示示例库,覆盖了代码处理、创意写作、语言翻译、数据结构化、角色交互等多样化场景,适用于开发者、内容创作者、教育工作者等群体。

https://api-docs.deepseek.com/zh-cn/prompt-library/


【声明】内容源于网络
0
0
二进制跳动
15 年 + 技术老兵 架构师|技术总监|科技创业技术合伙人 曾任职苏宁科技、电讯盈科、联想云 专注架构设计与技术落地
内容 739
粉丝 0
二进制跳动 15 年 + 技术老兵 架构师|技术总监|科技创业技术合伙人 曾任职苏宁科技、电讯盈科、联想云 专注架构设计与技术落地
总阅读284
粉丝0
内容739