新智元报道
编辑:亚当
【新智元导读】
谷歌DeepMind正式升级Gemini API,支持内置工具与自定义函数混合调用、跨步骤上下文自动流转、Google Maps原生集成。Agent开发正从“手动编排”迈向“声明式构建”。
Gemini API三大核心升级
内置工具 + 自定义函数:一次请求全搞定
此前,开发者需在内置工具(如Google搜索)和自定义后端API之间手动切换,完成多步任务往往需多次请求与结果中转。
新版Gemini 3支持在同一请求中并行调用Google搜索、Google Maps及用户自定义函数,并自动决策执行顺序与数据衔接逻辑。
示例场景:“查找今日最火的降噪耳机,并确认仓库库存”——Gemini先检索热门型号,再自动调用库存API逐一比对,单次调用即可闭环,延迟与代码量显著降低。
上下文环流:AI具备链式记忆能力
新增「上下文环流」(Context Circulation)机制,确保每次工具调用及返回结果均持久保留在模型上下文窗口内,后续步骤可直接引用任意历史输出。
配合唯一标识的Tool Response ID,系统能精准匹配并行调用的输入与响应,大幅提升多线程调试效率。
例如:Gemini通过内置工具获取“柏林亚历山大广场实时天气(30°C,晴)”,随即在调用自定义场地预订工具时自动触发露天方案选择,全程无需人工干预数据传递。
Google Maps原生集成:地理空间能力深度嵌入
Google Maps正式接入Gemini 3全系模型,支持实时营业状态查询、步行距离筛选、通勤时间估算、商家详情获取等地理感知功能。
只需数行代码即可启用:
from google import genai
client = genai.Client()
interaction = client.interactions.create(
model="gemini-3-flash-preview",
input="Find three highly-rated coffee shops open right now within walking distance of Alexanderplatz in Berlin.",
tools=[{"type": "google_maps"}],
)
从“编排噩梦”到“声明式Agent”
三项更新共同指向一个根本转变:开发者不再需要编写复杂调度逻辑,只需声明可用工具集合;调用时机、上下文管理、并行协调均由Gemini自主完成。
这标志着AI Agent基础设施正由“手工作坊模式”加速迈入“工业化生产阶段”。工具混用、上下文环流、地理空间接入,不再是碎片化特性,而是支撑Agent规模化落地的核心底座。
谷歌同步推出Interactions API,强化服务端状态管理与长周期任务处理能力;但当前生产环境仍推荐以GenerateContent为主要调用路径。

