研究方向
INSAIT 正在面向全球招收博士研究生,加入由 Google 联合资助并联合指导的前沿研究项目,致力于推动 基于多模态大语言模型(Multimodal LLMs)的第一人称视觉(Egocentric Vision)研究。随着智能眼镜、AR/VR 头显等可穿戴设备的不断发展,理解基于第一人称的视频内容的重要性日益凸显。我们的目标是研发能够实时感知、记忆与推理的人工智能,实现自适应、上下文感知的智能体,更自然地理解和交互第一人称视频内容。
团队背景
你将获得来自 INSAIT 团队(Dr. Yuqian Fu、Dr. Danda Pani Paudel、Prof. Luc Van Gool)和 Google 苏黎世团队(Dr. Yongqin Xian、Dr. Alessio Tonioni、Dr. Federico Tombari)的联合指导。其中,Luc Van Gool 是计算机视觉领域全球被引用次数排名前 15 的顶级学者,Federico Tombari 目前担任 Google 苏黎世研究院科研主任。
工作地址
保加利亚 · 索菲亚
我们提供
-
每月 €3,307 的薪资 -
强有力的学术指导 -
在顶级国际会议(CVPR、ICCV、ECCV、NeurIPS、ICLR、ICML)发表论文的机会 -
参加国际会议与科研访问的资助
我们希望你
-
具备扎实的机器学习或计算机视觉背景 -
熟练掌握Python与PyTorch/TensorFlow编程 -
对视频理解与多模态 AI 充满兴趣 -
有顶会论文发表经历者优先
入学时间
灵活(2025/2026,鼓励尽早申请)
申请方式
INSAIT官网申请(申请时请注明 “INSAIT-Google-Egocentric Vision”)
申请事项咨询请联系:yuqian.fu@insait.ai
公众号后台回复“数据集”获取100+深度学习各方向资源整理
极市干货

点击阅读原文进入CV社区
收获更多技术干货

