大数跨境
0
0

斯坦福开源:生成训练数据的系统

斯坦福开源:生成训练数据的系统 GitHubTopp
2024-05-08
0
导读:人工智能模型的基础资料:数据!训练数据!

人工智能模型的基础资料:数据!训练数据!

一种弱监督快速生成训练数据的系统

源代码

http://www.gitpp.com/dogai/snorkel


Snorkel项目的起源、发展和影响,以及Snorkel Flow平台的创建和目的。以下是对文本的详细解读:

  1. Snorkel项目的起源:该项目于2015年在斯坦福大学启动,基于一个技术赌注,即训练数据的质量将越来越决定机器学习项目的成功或失败,而不是模型、算法或基础设施。项目团队探索了一个激进的想法,即将数学和系统结构引入通常混乱且手动的训练数据创建和管理过程中,使用户能够以编程方式标记、构建和管理训练数据。

  2. Snorkel项目的发展和影响:该项目取得了巨大成功,其影响力超出了预期。原本的目标只是提供一个最小可行的框架来测试和验证假设,但在四年后,该项目不仅实现了这一目标,还与Google、Intel、Stanford Medicine等世界领先的组织合作,产生了60多篇同行评审出版物,并被纳入顶尖大学的课程。此外,该项目还支持了许多生产部署,并与来自各个领域的研究人员和从业者建立了合作。

  3. Snorkel项目的更广泛影响:通过与用户的交流,项目团队意识到Snorkel项目只是第一步。该项目不仅改变了训练数据的标记方式,还改变了构建、部署和管理机器学习的整个生命周期和流程。这包括用户如何注入他们的知识,如何构建、训练、检查、版本控制和监控模型,以及如何将整个流程中的利益相关者纳入其中。

  4. Snorkel Flow平台的创建和目的:为了支持这一更广泛的愿景,项目团队创建了Snorkel Flow平台。这是一个用于开发和部署人工智能应用程序的端到端机器学习平台,结合了Snorkel项目的许多概念和一系列新技术。这些技术包括弱监督建模、数据增强、多任务学习、数据切片和结构化、监控和分析等。通过将这些技术以一种大于各部分之和的方式集成在一起,Snorkel Flow旨在使机器学习比以往更快、更灵活、更实用。

总的来说,这篇文本展示了Snorkel项目从起源到发展再到产生广泛影响的过程,并介绍了其后续平台Snorkel Flow的创建和目的。通过整合各种先进技术,Snorkel Flow平台有望推动机器学习领域的发展,使其更加快速、灵活和实用。



人工智能模型的基础资料: 数据! 训练数据!

一种弱监督快速生成训练数据的系统

源代码

http://www.gitpp.com/dogai/snorkel


【声明】内容源于网络
0
0
GitHubTopp
top开源系统分享
内容 444
粉丝 0
GitHubTopp top开源系统分享
总阅读70
粉丝0
内容444