大数跨境
0
0

【好文分享】如何做出顶级AI研究?OpenAI科学家Jason Wei《AI研究思考》演讲,讲述杰出与普通研究之差别

【好文分享】如何做出顶级AI研究?OpenAI科学家Jason Wei《AI研究思考》演讲,讲述杰出与普通研究之差别 极市平台
2023-10-27
2
↑ 点击蓝字 关注极市平台
作者丨Jason Wei
来源丨书生 OpenGVLab

极市导读

 

如何做出世界级影响力的AI研究?我们来听听OpenAI科学家Jason Wei在伯克利的报告《AI研究思考》。 >>加入极市CV技术交流群,走在计算机视觉的最前沿

如何做出世界级影响力的AI研究?我们来听听OpenAI科学家Jason Wei在伯克利的报告《AI研究思考》。本文主要内容转自他的推特与谷歌文档,这些内容令我们产生共鸣,搬运至此,与各位科研同行分享。
作者OpenAI科学家Jason Wei:毕业于达特茅斯大学,之前,他在Google Brain担任高级研究科学家,在大模型研发领域拥有丰富的经验和杰出成就,在谷歌工作期间曾主导推广了大语言模型中包括思维链提示、指令微调和模型涌现在内一系列关键思想的诞生。

链接:https://x.com/_jasonwei/status/1715080315587440719?s=20

过去的几年里,我与一些极为才华横溢的研究者合作并进行了观察,我注意到了以下趋势:(以下所提普通研究者无任何贬义,进行研究都需要付出大量努力)
  1. 当开始一个项目时,普通研究者往往会迅速跳到建模提议、架构设计、新思路等。而杰出的研究者通常首先会手动查看数据和与模型互动,深入了解问题,然后再提出(通常是简单的)方法。
  2. 普通研究者可能经常编写乱七八糟、不可重用且需要多个独立步骤的代码。而杰出的人往往也是优秀的软件工程师——他们的代码可以轻松地扩展用于未来的实验,他们编写详尽的测试,并且建设基础设施以迅速进行多次实验并用最少的点击次数可视化结果。
  3. 虽然普通研究者可能主要是独自工作或与一两个人合作,但杰出的人知道研究是一种社交活动。他们与经验各异的人合作,分享研究成果,并有说服力地传达他们的愿景。
  4. 普通研究者可能会陷入“兔子洞”——如果他们的实验结果只是普通,他们会花3个多星期撰写并提交到会议。而杰出的人在知道某种方法不会取得重大突破时,会迅速转向其他研究。
  5. 如果普通研究者取得了一些成功,他们可能会试图继续做他们觉得舒适的事情,即使这样的方法变得过时。而杰出的人能迅速调整,并不断适应新的进展和范式。
  6. 普通研究者经常实施针对特定任务的解决方案,这些方案针对单一任务进行了大量优化。杰出的人也可能努力做特定任务,但他们会试图思考通用方法。
  7. 普通研究者谈论并优化论文或会议的接受率。我从未遇到一个真正关心这些事情的杰出研究者。


(以下是Jason分享的PPT文档,通过文末的推特链接可以查看

大纲:
  • 杰出的研究者
  • 作为实践的研究
  • 优秀和糟糕的论文
  • 有前景的研究方向

01

 普通研究者  VS 杰出研究者

普通的研究者

杰出的研究人员

  • 草率地提议

  • 匆匆拼凑出勉强可用的代码

  • 可能主要独自工作

  • 可能会卡在具体问题中

  • 持续做自己擅长的事情

  • 创建特定任务的解决方案

  • 写许多普通的论文

  • 仔细查看数据
  • 通常是优秀的软件工程师
  • 良好的协作和沟通
  • 选择更有价值的项目
  • 快速适应新的模式
  • 创建通用解决方案
  • 写一些能颠覆行业的论文


做一个好的研究者只需要练习:
  1. 选择构思
  2. 设计和执行实验
  3. 写论文
  4. 影响最大化

1.选择一个研究主题

2.设计和执行实验

3.写论文

4.最大化影响

0.META-级别

  • 找到一个强大的合作者团队

    -他们会促使你做好以上四项技能

  • 尝试与一位出色的合作者合作

    -努力给他们留下深刻印象,而他们对渐进的想法不感兴趣

  • 了解为什么有些研究人员如此优秀

    -你会知道要继续学习什么技能

02

优秀的和不佳的科研成果案例


杰出的研究BERT,T5,GPT-2/3/4,InstructGPT等等

优秀科研成果案例:

03

有前景的研究方向


推特原文链接:
https://x.com/_jasonwei/status/1715080315587440719?s=20



公众号后台回复“数据集”获取100+深度学习各方向资源整理

极市干货

技术专栏:多模态大模型超详细解读专栏搞懂Tranformer系列ICCV2023论文解读极市直播
极视角动态欢迎高校师生申报极视角2023年教育部产学合作协同育人项目新视野+智慧脑,「无人机+AI」成为道路智能巡检好帮手!
技术综述:四万字详解Neural ODE:用神经网络去刻画非离散的状态变化transformer的细节到底是怎么样的?Transformer 连环18问!

点击阅读原文进入CV社区

收获更多技术干货


【声明】内容源于网络
0
0
极市平台
为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
内容 8155
粉丝 0
极市平台 为计算机视觉开发者提供全流程算法开发训练平台,以及大咖技术分享、社区交流、竞赛实践等丰富的内容与服务。
总阅读3.2k
粉丝0
内容8.2k