(一)核心架构对比
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
(二)原理
1、ChatGPT Deep Research原理
ChatGPT 的 Deep Research 是一个端到端的自动化研究代理。
它不仅仅是搜索,而是像人类研究员一样思考。
(1)任务规划 (Planning)
当用户输入一个复杂问题(如“2025年AI对医疗的影响”),系统首先不急于回答,而是利用 LLM 生成一个详细的执行计划。
这个计划包含多个子任务,例如:“查找AI在癌症筛查中的应用”、“寻找最新的临床试验数据”等。
(2)迭代搜索 (Iterative Search)
系统根据计划,自动调用网络搜索工具(Browser)去执行这些子任务。
这是ReAct模式(Reasoning and Acting)的体现——先推理需要什么信息,再采取行动去获取。
(3)知识整合与报告 (Synthesis)
收集到数百个网页的结果后,ChatGPT 不会直接拼接,而是进行深度阅读和摘要。
最终输出一份结构化的报告,通常包含目录、章节摘要和参考文献,看起来就像一篇微型的学术论文。
2、Gemini DeepSearch 原理
Gemini 的 DeepSearch 更像是一个超级 RAG 引擎,它的核心在于处理海量信息的能力。
(1)多阶段检索
它将研究过程分为四个阶段:规划 (Plan)、搜索 (Search)、论证 (Argue) 和 报告 (Report)。
(2)混合数据源
除了网络,Gemini DeepSearch 可以直接连接用户的 Gmail、Google Drive 和 Google Chat,这意味着它能利用你个人的历史邮件和文件来辅助回答,这是 ChatGPT 目前难以做到的。
(3)原生多模态
在搜索过程中,它可以同时处理文本、图片和视频,直接在搜索结果中分析图表或视频内容,而无需转述
(三)技术规格参数对比
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|

