大数跨境
0
0

博士申请|INSAIT 与 Google 联合指导的前沿性研究项目:基于多模态大模型的第一人称视觉研究

博士申请|INSAIT 与 Google 联合指导的前沿性研究项目:基于多模态大模型的第一人称视觉研究 极市平台
2025-09-01
0
导读:聚焦基于多模态大语言模型的第一人称视觉研究
↑ 点击蓝字 关注极市平台


研究方向

INSAIT 正在面向全球招收博士研究生,加入由 Google 联合资助并联合指导的前沿研究项目,致力于推动 基于多模态大语言模型(Multimodal LLMs)的第一人称视觉(Egocentric Vision)研究。随着智能眼镜、AR/VR 头显等可穿戴设备的不断发展,理解基于第一人称的视频内容的重要性日益凸显。我们的目标是研发能够实时感知、记忆与推理的人工智能,实现自适应、上下文感知的智能体,更自然地理解和交互第一人称视频内容。

团队背景

你将获得来自 INSAIT 团队(Dr. Yuqian Fu、Dr. Danda Pani Paudel、Prof. Luc Van Gool)和 Google 苏黎世团队(Dr. Yongqin Xian、Dr. Alessio Tonioni、Dr. Federico Tombari)的联合指导。其中,Luc Van Gool 是计算机视觉领域全球被引用次数排名前 15 的顶级学者,Federico Tombari 目前担任 Google 苏黎世研究院科研主任。

工作地址

保加利亚 · 索菲亚

我们提供

  1. 每月 €3,307 的薪资
  2. 强有力的学术指导
  3. 在顶级国际会议(CVPR、ICCV、ECCV、NeurIPS、ICLR、ICML)发表论文的机会
  4. 参加国际会议与科研访问的资助

我们希望你

  1. 具备扎实的机器学习或计算机视觉背景
  2. 熟练掌握Python与PyTorch/TensorFlow编程
  3. 视频理解多模态 AI 充满兴趣
  4. 有顶会论文发表经历者优先

入学时间

灵活(2025/2026,鼓励尽早申请)

申请方式

INSAIT官网申请(申请时请注明 “INSAIT-Google-Egocentric Vision”)

申请事项咨询请联系:yuqian.fu@insait.ai



公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列大视觉模型 (LVM) 解读扩散模型系列极市直播
技术综述:小目标检测那点事大模型面试八股含答案万字长文!人体姿态估计(HPE)入门教程

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读919
粉丝0
内容8.2k