大数跨境
0
0

Github 今日推荐 每秒解析GB级JSON!simdjson让Facebook都用的神级解析器

Github 今日推荐 每秒解析GB级JSON!simdjson让Facebook都用的神级解析器 大迈说电商
2025-09-15
3
导读:今日推荐:simdjson 是一个高性能的 C++ JSON 解析库,利用 SIMD 指令和并行算法实现每秒解析千兆字节级别的 JSON 数据,被 Facebook、Node.js、ClickHous
 今日推荐:simdjson

simdjson 是一个高性能的 C++ JSON 解析库,利用 SIMD 指令和并行算法实现每秒解析千兆字节级别的 JSON 数据,被 Facebook、Node.js、ClickHouse 等众多知名项目广泛使用。

1 markitdown

  • 今日星标

    702
  • 总星标数

    74045
  • 主要语言

    Python

https://github.com/microsoft/markitdown

markdownpdfopenaimicrosoft-officeautogenlangchainautogen-extension

MarkItDown 是一个 Python 工具,专门用来把各种文件(比如 PDF、Word、Excel、PPT 甚至音频和图片)转换成简洁的 Markdown 格式,特别适合给 AI 或文本分析工具使用。它保留了文档的结构(标题、表格、列表等),但不像专业排版工具那么精细。你可以通过命令行快速转换文件,还能用插件扩展功能,甚至调用 AI 来给图片生成描述。微软开源的这个项目,适合想用简单方式处理文档内容的人。

2 PowerShell

  • 今日星标

    692
  • 总星标数

    49673
  • 主要语言

    C#

https://github.com/PowerShell/PowerShell

windowsmacoslinuxshellcommand-linepowershellnetcorehacktoberfest

PowerShell是一个跨平台的自动化工具和配置框架,适用于Windows、Linux和macOS系统。它不仅能处理结构化数据(比如JSON和CSV),还能轻松对接REST API和命令行操作。无论你是想写脚本、管理服务器,还是整合现有工具,PowerShell都提供了一个强大的命令行环境和脚本语言来帮你高效完成任务。

3 system-prompts-and-models-of-ai-tools

  • 今日星标

    685
  • 总星标数

    84937

https://github.com/x1xhlol/system-prompts-and-models-of-ai-tools

open-sourceaivscodetraedevincursorboltcopilotv0windsurfperplexityreplitlovablegithub-copilotsystem-promptscursoraiwindsurf-aitrae-idetrae-aicluely

这个项目收集了多个热门AI工具(如Cursor、Devin、Replit Agent等)的系统提示词和内部模型,包含超过7000行代码和配置信息,帮助开发者了解这些工具的工作原理。所有内容由作者手动提取或整理自开源项目,部分来自官方版本。项目还提供了安全建议,并支持通过捐款或加密货币来持续更新和维护。

4 n8n-workflows

  • 今日星标

    361
  • 总星标数

    30064
  • 主要语言

    HTML

https://github.com/Zie619/n8n-workflows

这是一个收集了大量n8n自动化工作流的项目,就像是一个现成的"自动化菜谱大全"。它包含了2000多个开箱即用的工作流模板,覆盖了从消息通讯到数据处理的各类场景,还提供了智能搜索和分类功能,让你能快速找到适合自己需求的自动化方案。

5 simdjson

  • 今日星标

    357
  • 总星标数

    21845

https://github.com/simdjson/simdjson

c-plus-plusjsonarmneonx64clangcpp11simdjson-parseravx2json-pointerarm64aarch64avx512gcc-compilersse42vs2019clang-clloongarch

simdjson 是一个超快的 C++ JSON 解析库,它利用现代处理器的 SIMD 指令技术,每秒能解析数千兆字节的 JSON 数据。它比许多常用解析库快好几倍,被 Facebook、Node.js、ClickHouse 等众多知名项目使用,既保证速度又确保数据完整性和正确性。

6 Real-Time-Voice-Cloning

  • 今日星标

    201
  • 总星标数

    55468
  • 主要语言

    Python

https://github.com/CorentinJ/Real-Time-Voice-Cloning

pythondeep-learningtensorflowpytorchttsvoice-cloning

这是一个实时语音克隆工具,只需5秒的声音样本就能复制出该声音,并生成任意文本的语音内容。它采用深度学习技术,通过三个步骤实现:先提取声音特征,再结合文本合成语音,最后通过声码器实时输出。适合用来制作个性化语音或进行语音转换,操作简单且支持实时处理。

7 DeepCode

  • 今日星标

    177
  • 总星标数

    6114
  • 主要语言

    Python

https://github.com/HKUDS/DeepCode

llm-agentagentic-coding

DeepCode是一个由多智能体系统驱动的AI编程助手,它能将研究论文中的复杂算法或自然语言描述自动转换成可直接使用的代码。无论是前端网页、后端服务还是完整算法实现,你只需提供文字说明或文档,它就能生成高质量的生产级代码,大大提升开发效率。

8 opencode

  • 今日星标

    175
  • 总星标数

    23201
  • 主要语言

    TypeScript

https://github.com/sst/opencode

OpenCode 是一个专为终端打造的 AI 编程助手工具,可以帮你直接在命令行里写代码。它完全开源,支持多种 AI 模型提供商,特别适合喜欢在终端工作的开发者。安装方式很灵活,支持 curl 一键安装和各种包管理器,还能自定义安装路径。这个项目由 Neovim 用户和 terminal.shop 的创建者开发,特别注重提升终端用户体验,未来还可能支持远程控制等高级功能。

9 crawl4ai

  • 今日星标

    157
  • 总星标数

    53123
  • 主要语言

    Python

https://github.com/unclecode/crawl4ai

Crawl4AI 是一个开源的网页爬虫工具,专门为AI开发者设计,能快速抓取网页内容并转换成适合大语言模型处理的格式。它支持动态页面加载、智能内容提取,还能生成干净的Markdown文档,方便后续AI训练或数据分析。这个项目完全免费,由活跃的开发者社区维护,特别适合需要高效获取网页数据的场景,比如构建知识库或AI代理。安装简单,还能通过Docker快速部署,用起来很灵活。

10 ai-hedge-fund

  • 今日星标

    114
  • 总星标数

    40166
  • 主要语言

    Python

https://github.com/virattt/ai-hedge-fund

这是一个模拟AI对冲基金的教育性项目,通过多个不同投资风格的AI智能体(如巴菲特、木头姐等名人投资风格)协作分析股票,生成模拟交易决策。它整合了基本面分析、技术指标和市场情绪,但仅供学习研究,不涉及真实交易。支持本地或云端AI模型运行,提供回测功能,适合对量化投资和AI应用感兴趣的人探索。

11 ccxt

  • 今日星标

    46
  • 总星标数

    38296
  • 主要语言

    Python

https://github.com/ccxt/ccxt

apibotlibrarycryptobitcointradingethereumcryptocurrencyexchangemarket-datastrategybtccryptocurrenciestradeetharbitragealtcoinmerchantinvestmemecoin

CCXT是一个强大的加密货币交易库,支持JavaScript、Python、PHP、C#和Go等多种编程语言。它集成了超过100家加密货币交易所的API,让开发者可以轻松连接并交易比特币、以太坊等数字货币。无论是获取市场数据、开发交易算法,还是构建自动化交易机器人,CCXT都提供了统一且易用的接口。它适合程序员、数据分析师和量化交易者使用,帮助快速实现跨交易所的套利、策略回测等功能。

12 Perplexica

  • 今日星标

    36
  • 总星标数

    24442
  • 主要语言

    TypeScript

https://github.com/ItzCrazyKns/Perplexica

search-enginemachine-learningartificial-intelligencesearxngai-search-engineperplexity-aiopen-source-perplexity-aiopen-source-ai-search-engineperplexicasearxng-copilot

Perplexica 是一个开源的 AI 搜索引擎,可以像 Perplexity AI 一样帮你深入搜索网络并理解问题,给出清晰答案和来源。它支持本地 AI 模型(如 Llama3)和多种搜索模式,比如学术研究、视频搜索等,还能保护隐私。你可以用 Docker 快速安装,或者通过 API 集成到自己的应用里。

13 midday

  • 今日星标

    36
  • 总星标数

    12159
  • 主要语言

    TypeScript

https://github.com/midday-ai/midday

financetypescriptnextjstailwindsupabase

Midday是一个专为自由职业者设计的一站式业务管理工具,集成了时间追踪、发票管理、文件存储和财务概览等功能。它能自动匹配账单和收据,提供安全文件存储,还能通过智能助手分析财务状况。基于现代技术栈开发,支持多平台使用,帮助自由职业者更高效地管理日常工作。

14 mlx-lm

  • 今日星标

    18
  • 总星标数

    2046
  • 主要语言

    Python

https://github.com/ml-explore/mlx-lm

mlxllms

mlx-lm 是一个可以在苹果芯片上高效运行和微调大语言模型(LLM)的 Python 工具包。它支持从 Hugging Face 直接加载模型,可以量化模型以节省内存,还提供了生成文本、对话交互和微调模型的功能,让用户能在本地设备上快速体验和部署 AI 模型。

15 open-battery-information

  • 今日星标

    15
  • 总星标数

    388
  • 主要语言

    C++

https://github.com/mnh-jansson/open-battery-information

这是一个帮助修复电池的开源项目,很多电池的BMS管理系统被厂家锁定后就无法使用,但其实电池本身可能并没有问题。这个项目提供了工具和信息,教你如何通过Arduino和电脑软件来解锁和重置电池,让还能用的电池不被浪费,既环保又省钱。

16 OrcaSlicer

  • 今日星标

    11
  • 总星标数

    10740
  • 主要语言

    C++

https://github.com/SoftFever/OrcaSlicer

makers3d-printing3d-printer

OrcaSlicer 是一款开源的 3D 打印切片软件,它能够将三维模型转换成打印机可以识别的 G 代码指令。它支持多种主流品牌的 3D 打印机,比如 Bambu Lab、Prusa、Creality 等,并提供了丰富的打印优化功能,比如智能支撑生成、高速切片、压力校准等,帮助用户打出更精准、质量更高的模型。它界面友好,社区活跃,适合从新手到专业玩家的各类用户使用。

【声明】内容源于网络
0
0
大迈说电商
跨境分享台 | 每日分享行业动态
内容 45790
粉丝 1
大迈说电商 跨境分享台 | 每日分享行业动态
总阅读235.3k
粉丝1
内容45.8k