大数跨境
0
0

GEO之AI深度搜索:ChatGPT DeepResearch VS Gemini DeepSearch

GEO之AI深度搜索:ChatGPT DeepResearch VS Gemini DeepSearch TechX 出海实验室
2025-12-10
3
导读:GEO基础

(一)核心架构对比

ChatGPT Deep Research
Gemini DeepSearch
OpenAI
Google
核心逻辑: ReAct + 自动化代理
多阶段检索增强 (RAG)
优势: 强大的自动化规划能力,能自动拆解复杂任务
优势: 极其强大的上下文窗口(Context Window),支持超长文档分析。
特点: 侧重于生成结构化的长篇报告,类似学术论文格式。
特点: 强调多模态理解,结合 Gmail/Drive 内部数据的能力更强。

(二)原理

1、ChatGPT Deep Research原理

ChatGPT 的 Deep Research 是一个端到端的自动化研究代理。

它不仅仅是搜索,而是像人类研究员一样思考。

(1)任务规划 (Planning)

当用户输入一个复杂问题(如“2025年AI对医疗的影响”),系统首先不急于回答,而是利用 LLM 生成一个详细的执行计划。

这个计划包含多个子任务,例如:“查找AI在癌症筛查中的应用”、“寻找最新的临床试验数据”等。

(2)迭代搜索 (Iterative Search)

系统根据计划,自动调用网络搜索工具(Browser)去执行这些子任务。

这是ReAct模式(Reasoning and Acting)的体现——先推理需要什么信息,再采取行动去获取。

(3)知识整合与报告 (Synthesis)

收集到数百个网页的结果后,ChatGPT 不会直接拼接,而是进行深度阅读和摘要。

最终输出一份结构化的报告,通常包含目录、章节摘要和参考文献,看起来就像一篇微型的学术论文。

2、Gemini DeepSearch 原理

Gemini 的 DeepSearch 更像是一个超级 RAG 引擎,它的核心在于处理海量信息的能力。

(1)多阶段检索

它将研究过程分为四个阶段:规划 (Plan)、搜索 (Search)、论证 (Argue) 和 报告 (Report)。

(2)混合数据源

除了网络,Gemini DeepSearch 可以直接连接用户的 Gmail、Google Drive 和 Google Chat,这意味着它能利用你个人的历史邮件和文件来辅助回答,这是 ChatGPT 目前难以做到的。

(3)原生多模态

在搜索过程中,它可以同时处理文本、图片和视频,直接在搜索结果中分析图表或视频内容,而无需转述

(三)技术规格参数对比

参数
ChatGPT Deep Research
Gemini DeepSearch
核心架构
Agent-based (基于代理)
Retrieval-Augmented Generation (RAG增强)
上下文限制
128k - 256k Tokens
Up to 2M+ Tokens (Gemini 2.0)
引用方式
自动生成 BibTeX 格式
自动标注来源链接
数据源
公共互联网
互联网 + Gmail/Drive/Chat

【声明】内容源于网络
0
0
TechX 出海实验室
1234
内容 52
粉丝 0
TechX 出海实验室 1234
总阅读297
粉丝0
内容52