DeepSeek:基础对话篇(像交朋友一样学交流)- 大数跨境

首页

DeepSeek:基础对话篇(像交朋友一样学交流)

二进制跳动

2025-02-12

导读：DeepSeek:基础对话篇(像交朋友一样学交流)

1. 巧用三种模式

DeepSeek 提供基础模型、深度思考 (R1) 和联网搜索三种模式，分别适用于不同场景：

基础模型：适用于大多数日常需求，性能比肩全球顶尖模型。

深度思考 (R1): 擅长处理数理逻辑、代码和复杂问题，适合深度推理任务。联网搜索：结合网络搜索结果回答问题，适用于知识库截止日期之后的问题。

2. 模型性能对比

V3 模型：采用 Moe 架构，618B 参数，擅长百科知识，回答速度快。

R1 模型：采用后训练 + RL 学习技术，660B 参数，擅长逻辑推理，回答速度较慢。

联网搜索：通常不与深度思考同时使用，以免影响智能表现。

3. 知识更新至 2024 年 7 月

DeepSeek 的预训练数据更新至 2024 年 7 月，对于此日期之前的问题，通常无需开启联网功能；对于之后的问题，建议开启联网功能以获得更佳效果。

4. 提示词核心：准确表达

DeepSeek 对提示词要求不高，关键在于准确表达需求。通用提示词模板包括 “你是谁 + 你的目标”，并可根据需要补充背景信息。

5. 与 DeepSeek 沟通，尽量说人话与 DeepSeek 沟通时，使用直白、俗气的语言更能激发其潜能，例如模仿特定人物风格写作。

6. 我是一名小学生

为避免 R1 生成内容过于结构化和死板，可提示 DeepSeek 使用适合特定年龄段的语言，如 “请用小学生能听懂的话解释”。

7. 活用联网搜索

DeepSeek 支持推理 + 联网搜索，可处理知识库截止日期之后的问题，例如根据最新事件创作故事。

8. 活用上传附件

DeepSeek 支持上传附件 (最多 50 个，每个不超过 100MB)，可基于自有知识库进行推理、思考，适用于本地化、私密需求。

9. 活用 V3+R1

可将 V3 模型和 R1 模型结合使用，先用 V3 获取细节和提示词，再用 R1 进行深度推理和输出，提升模型能力。

10.R1 的三个开放

DeepSeek 对 R1 模型实现了三个开放：

思维链全开放：可查看完整、透明的思考过程。

训练技术全部公开：采用 RL 强化学习技术，提升推理能力。

开源 2+6 个模型：提供不同参数规模的模型，最小 1.5B 参数，10G 显存可运行。

有效提问的五个黄金法则

法则一：明确需求

错误示例：[帮我写点东西]

正确姿势：[我需要一封求职信，应聘新媒体运营岗位，强调 3 年公众号运营经验]

法则二：提供背景

错误示例：[分析这个数据]

正确姿势：[这是一家奶茶店过去三个月的销售数据，请分析周末和工作日的销量差异 (附 CSV 数据)]

法则三：指定格式

错误示例：[给几个营销方案]

正确姿势：[请用表格形式列出三种情人节咖啡店促销方案，包含成本预估和预期效果]

法则四：控制长度

错误示例：[详细说明]

正确姿势：[请用 200 字以内解释区块链技术，让完全不懂技术的老人能听懂]

法则五：及时纠正

当回答不满意时，比如：

[这个方案成本太高，请提供预算控制在 500 元以内的版本。]
[请用更正式的语气重写第二段]

新手必学的 10 个魔法指令基础指令集：

续写：当回答中断时自动继续生成
简化：将复杂内容转换成大白话
示例：要求展示实际案例 (特别是写代码时)
步骤指导：让 AI 分步指导操作流程
检查：帮你发现文档中的错误

场景演练：

输入 [步骤：如何用手机拍摄美食照片]，观察分步指导
输入 [请解释量子计算，然后 / 简化]，对比前后差异

最后附上一份官方提示示例库，覆盖了代码处理、创意写作、语言翻译、数据结构化、角色交互等多样化场景，适用于开发者、内容创作者、教育工作者等群体。

https://api-docs.deepseek.com/zh-cn/prompt-library/

【声明】内容源于网络

二进制跳动

15 年 + 技术老兵架构师｜技术总监｜科技创业技术合伙人曾任职苏宁科技、电讯盈科、联想云专注架构设计与技术落地

内容 739

粉丝 0

二进制跳动 15 年 + 技术老兵架构师｜技术总监｜科技创业技术合伙人曾任职苏宁科技、电讯盈科、联想云专注架构设计与技术落地

总阅读284

粉丝0

内容739