大数跨境
0
0

GitHub项目:人工智能时代,谁最赚钱?数据标注业务是淘金热时代的铲子业务

GitHub项目:人工智能时代,谁最赚钱?数据标注业务是淘金热时代的铲子业务 GitHubTopp
2023-11-09
0
导读:大家好,我是CitHub TOP君,每天分享GitHub上最TOP的开源项目。人工智能时代,谁最赚钱?回答这

大家好,我是CitHub TOP君,每天分享GitHub上最TOP的开源项目。

人工智能时代,谁最赚钱?回答这个问题,不妨想想,淘金热时代谁最赚钱

今天介绍数据标注开源项目label-studio

https://github.com/HumanSignal/label-studio


数据标注业务,去百度众包,直接可以接项目赚钱啦!

Label Studio 是一款开源的标注工具,适用于数据标注和图像分类任务。它旨在为数据科学家、机器学习工程师和研究人员提供一种简单、高效的方式,以便于他们对数据进行标注和处理。在百度众测,可以接数据标注的活。

Label Studio 主要特点如下:

1. 开源:Label Studio 是开源的,你可以放心地在其基础上进行修改和定制。

2. 灵活的标注模式:Label Studio 支持多种标注模式,如分类、物体检测、语义分割等。

3. 界面友好:Label Studio 的界面简洁、直观,易于上手。

4. 丰富的标注工具:Label Studio 提供了丰富的标注工具,如框选、多边形、文本等。

5. 团队协作:Label Studio 支持多人同时进行标注,便于团队协作。

6. 项目管理和协作:Label Studio 提供了项目管理和协作功能,可以方便地组织和管理标注任务。

7. 兼容性:Label Studio 支持多种操作系统,如 Windows、macOS 和 Linux。

8. 扩展性:Label Studio 可以通过插件扩展功能,用户可以根据需求安装所需的插件。

9. 社区支持:Label Studio 有一个活跃的社区,用户可以在社区中寻求帮助、分享经验和讨论问题。

10. 大量教程和资源:Label Studio 提供了丰富的教程和资源,帮助用户快速上手和提高标注效率。

总之,Label Studio 是一款功能强大、易于使用、灵活且开放的数据标注工具,适用于各种标注任务,无论是个人还是团队都可以从中受益。

如今人工智能的主流训练模式就是“题海战术”,让人工智能做足够多的题目,再用答案告诉它对错,人工智能算法经过一遍遍训练,慢慢地就能明白怎么做题。


比如要培训人工智能识别照片里的猫,就要给他足够多猫的照片,提前把图片中的猫标注出来,一张张让AI自己识别,再对照答案判断对错,不断反复AI识别猫的能力就能越来越强。


数据标注做的就是把图片、声音中的关键信息标注、翻译成人工智能可以理解的内容,数据标注的好坏决定了人工智能训练成果的好坏。


这个行业很长一段时间都非常依赖人工,为此还兴起了“数据标注师”的职业,每天就是在各种图片上框选好物体,标上名字,特斯拉、英伟达为了训练自己的人工智能都有数千人以上的标注团队。


中国数据标注行业其实早有不少企业在做,耐不住大家“内卷“得太厉害,最后变成和外卖行业一样过度比拼人力的状态,产业没有得到真正的规模化发展。



Label Studio 是一个开源数据标记工具。它允许您使用简单直观的 UI 来标记音频、文本、图像、视频和时间序列等数据类型,并导出为各种模型格式。它可用于准备原始数据或改进现有训练数据以获得更准确的机器学习模型。

  • 尝试Label Studio


  • 多用户标签注册和登录,当您创建注释时,它会与您的帐户绑定。

  • 多个项目可在一个实例中处理您的所有数据集。

  • 简化的设计可帮助您专注于您的任务,而不是如何使用软件。

  • 可配置的标签格式让您可以自定义可视化界面,以满足您的特定标签需求。

  • 支持多种数据类型,包括图像、音频、文本、HTML、时间序列和视频。

  • Amazon AWS S3、Google Cloud Storage 中的文件或云存储或 JSON、CSV、TSV、RAR 和 ZIP 存档导入。

  • 与机器学习模型集成,以便您可以可视化和比较不同模型的预测并执行预标记。

  • 将其嵌入您的数据管道REST API 可以轻松使其成为管道的一部分


使用 Docker 在本地安装

官方 Label Studio docker 镜像在这里,可以通过docker pull. 在 Docker 容器中运行 Label Studio 并通过 访问它http://localhost:8080

docker pull heartexlabs/label-studio:latest
docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest

您可以在该目录中找到所有生成的资产,包括SQLite3数据库存储label_studio.sqlite3和上传的文件./mydata

覆盖默认的 Docker 安装

您可以通过附加新参数来覆盖默认启动命令:

docker run -it -p 8080:8080 -v $(pwd)/mydata:/label-studio/data heartexlabs/label-studio:latest label-studio --log-level DEBUG

使用 Docker 构建本地镜像

如果您想构建本地镜像,请运行:

docker build -t heartexlabs/label-studio:latest .

使用 Docker Compose 运行

Docker Compose 脚本提供了由以下组件组成的生产就绪堆栈:

  • 标签工作室

  • Nginx - 代理Web服务器,用于加载各种静态数据,包括上传的音频、图像等。

  • PostgreSQL - 生产就绪数据库,取代性能较差的 SQLite3。

要开始使用该应用程序,请http://localhost运行以下命令:

docker-compose up

使用 Docker Compose + MinIO 运行

您还可以使用额外的 MinIO 服务器来运行它以进行本地 S3 存储。当您想要测试本地系统上 S3 存储的行为时,这特别有用。要以这种方式启动 Label Studio,您需要运行以下命令:

# Add sudo on Linux if you are not a member of the docker group
docker compose -f docker-compose.yml -f docker-compose.minio.yml up -d

如果您没有静态 IP 地址,则必须在主机文件中创建一个条目,以便 Label Studio 和您的浏览器都可以访问 MinIO 服务器。有关更详细的说明,请参阅我们的数据存储指南。

使用 pip 本地安装

# Requires Python >=3.8
pip install label-studio

# Start the server at http://localhost:8080
label-studio

使用 Anaconda 进行本地安装

conda create --name label-studio
conda activate label-studio
conda install psycopg2
pip install label-studio

安装用于本地开发

您可以在本地运行最新的 Label Studio 版本,而无需使用 pip 安装软件包。

# Install all package dependencies
pip install -e .
# Run database migrations
python label_studio/manage.py migrate
python label_studio/manage.py collectstatic
# Start the server in development mode at http://localhost:8080
python label_studio/manage.py runserver

部署在云实例中

您可以在 Heroku、Microsoft Azure 或 Google Cloud Platform 中一键部署 Label Studio:

  

应用前端更改

Label Studio 应用程序的前端部分位于该frontend/文件夹中,并用 React JSX 编写。如果您在那里进行了一些更改,则应在构建/启动实例之前运行以下命令:

cd label_studio/frontend/
yarn install --frozen-lockfile
npx webpack
cd ../..
python label_studio/manage.py collectstatic --no-input

安装疑难解答

如果您在安装过程中看到任何错误,请尝试重新运行安装

pip install --ignore-installed label-studio

在 Windows 上安装依赖项

要在 Windows 上运行 Label Studio,请从Gohlke 版本下载并安装以下wheel包,以确保您使用正确版本的Python:

  • lxml

# Upgrade pip 
pip install -U pip

# If you're running Win64 with Python 3.8, install the packages downloaded from Gohlke:
pip install lxml‑4.5.0‑cp38‑cp38‑win_amd64.whl

# Install label studio
pip install label-studio

运行测试套件

要将测试的依赖项添加到本地安装:

pip install -r deploy/requirements-test.txt

或者,可以从安装了测试依赖项的 Docker 容器运行单元测试:

make build-testing-image
make docker-testing-shell

无论哪种情况,要运行单元测试:

cd label_studio

# sqlite3
DJANGO_DB=sqlite DJANGO_SETTINGS_MODULE=core.settings.label_studio pytest -vv

# postgres (assumes default postgres user,db,pass. Will not work in Docker
# testing container without additional configuration)
DJANGO_DB=default DJANGO_SETTINGS_MODULE=core.settings.label_studio pytest -vv



数据标注开源项目

https://github.com/HumanSignal/label-studio

数据标注业务,去百度众包,直接可以接项目赚钱啦!


我们收集了10000+项目 源代码 按照开源协议 都可以二开赚钱

点击 阅读原文

【声明】内容源于网络
0
0
GitHubTopp
top开源系统分享
内容 444
粉丝 0
GitHubTopp top开源系统分享
总阅读315
粉丝0
内容444