大数跨境
0
0

报名丨Computer use&Voice Agent :使用 TEN 搭建你的 Mac Assistant

报名丨Computer use&Voice Agent :使用 TEN 搭建你的 Mac Assistant RTE开发者社区
2025-02-14
0
导读:搭建自己的「Jarvis」,用语音来控制 Mac 操作。

与 TEN 相聚在「LET’S VISION 2025」大会,欢迎来展位上跟我们交流。这次我们还准备了一场聚焦「computer use」的工作坊,功能新鲜上线,线下首波体验!

📅 TEN 展位:2025年3月1日-2日

TEN workshop:2025年3月2日 13:30开始

📍 上海浦东鲜花港

TEN Framework 是一个主流对话式 Voice Agent 开源框架。基于 TEN 框架构建的实时对话 AI 引擎 TEN Agent,为开发者提供快速、高效的工具来构建实时对话式 AI Agent,以提供低延时、可打断的交互体验。


目前已集成 Deepseek、Gemini 2.0、OpenAI Realtime、RTC 等多种模型及组件,同时适配 Dify、Coze 主流编排工具。

项目地址
github.com/TEN-framework/TEN-Agent


往期文章

使用 TEN Agent+Deepseek 快速搭建语音助手



这场工作坊将带领大家尝试搭建自己的「Jarvis」,用语音来控制 Mac 操作。



工作坊适合人群

本课程面向具备一定编程基础的开发者:

• 会用命令行、git 和 docker;
• 需熟悉 macOS 基础开发知识;
• TEN 支持使用 C++、Go、Python 开发,有python/web开发经验者佳。

工作坊目标

TEN 是一个可方便开发 Voice Agent 的开源框架,本次工作坊将带领大家尝试搭建自己的「Jarvis」,用语音来控制 Mac 操作。

• 了解搭建 Voice Agent 的基本框架。

硬件与软件准备

硬件要求

• 电脑。

软件要求
• 提前下载安装 docker 和 docker compose;
我们会提供如下key:
• agora RTC key;
• LLM/TTS key。

阅读资料

• TEN 的Github仓库:https://github.com/TEN-framework/TEN-Agent;

• 可预先体验 TEN Agent demo:https://agent.theten.ai/

工作坊安排

基于 TEN 的 Computer use 实践(0.5小时)

实战:使用 TEN 搭建你的 Mac Assistant(2-3.5小时)

阶段一:了解熟悉 TEN 框架基础开发逻辑;

阶段二:在 Mac 上本地部署 Mac Assistant demo,使用 TEN Agent 控制你的 Mac 操作;

阶段三:高级挑战,自定义 tool,为 Mac Assistant 添加新的功能。

报名

1.报名工作坊需要预先购买大会门票(持有 BOOTH PASS 展区门票无法报名工作坊),RTE开发者社区专属门票优惠购买请扫描下方二维码。


2.拥有大会门票后,扫描下方二维码报名,选择“Computer Use & Voice Agent Practice: Build Your Mac Assistant with TEN”场次的工作坊”。名额有限,先到先得。









加入我们的 Voice Agent 社区


RTE 开发者社区持续关注 Voice Agent 和语音驱动的下一代人机交互界面。如果你对此也有浓厚兴趣,也期待和更多开发者交流(每个月都有线上/线下 meetup,以及学习笔记分享),欢迎加入我们的社区微信群,一同探索人和 AI 的实时互动新范式。


加入我们:加微信 Creators2022,备注身份和来意(公司/项目+职位+加群),备注完整者优先加群。




更多 Voice Agent 学习笔记:

多模态 AI 怎么玩?这里有 18 个脑洞

AI 重塑宗教体验,语音 Agent 能否成为突破点?

对话 TalktoApps 创始人:Voice AI 提高了我五倍的生产力,语音输入是人机交互的未来

a16z 最新语音 AI 报告:语音将成为关键切入点,但非最终产品本身(含最新图谱)

对话式 AI 硬件开发者都关心什么?低延迟语音、视觉理解、Always-on、端侧智能、低功耗……丨 RTE Meetup 回顾

2024,语音 AI 元年;2025,Voice Agent 即将爆发丨年度报告发布

对话谷歌 Project Astra 研究主管:打造通用 AI 助理,主动视频交互和全双工对话是未来重点

这家语音 AI 公司新融资 2700 万美元,并预测了 2025 年语音技术趋势

语音即入口:AI 语音交互如何重塑下一代智能应用

Gemini 2.0 来了,这些 Voice Agent 开发者早已开始探索……

【声明】内容源于网络
0
0
RTE开发者社区
RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。
内容 1122
粉丝 0
RTE开发者社区 RTE 开发者社区是聚焦实时互动领域的中立开发者社区。不止于纯粹的技术交流,我们相信开发者具备更加丰盈的个体价值。行业发展变革、开发者职涯发展、技术创业创新资源,我们将陪跑开发者,共享、共建、共成长。
总阅读1.4k
粉丝0
内容1.1k