挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #数据处理 #格式转换


🏵 Edit Banana - 统计格式转换框架

🍥 简介:
Edit Banana 是一款专为统计数据格式转换设计的框架。它提供了一套工具和接口,能够高效地将各种统计数据格式解析并转化为可编辑的结构,便于用户进行后续的数据处理、分析与操作。该框架旨在简化数据格式转换的复杂性,提升数据处理的灵活性和效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #数据存储


🏵 MemU - AI记忆管理系统

🍥 简介:
MemU使AI系统能摄取对话、文档和媒体,将其转换为结构化记忆,并存储在三级文件系统中。它提供快速嵌入搜索和深度基于LLM的数据检索,支持多种数据类型以及云端或自托管部署,并配有简洁的API。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #数据处理工具 #开源项目


🏵 CocoIndex - AI数据格式转换

🍥 简介:
CocoIndex是一款快速开源的数据处理工具,其核心使用Rust,外部接口采用Python。该工具专注于将原始数据高效转换为AI模型所需的特定格式,包括向量索引和知识图谱,以支持人工智能应用的数据预处理阶段。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #商业智能 #LLM应用 #数据分析 #开源项目


🏵 OpenChatBI - 基于大模型的数据智能分析

🍥 简介:
OpenChatBI 是一款基于大型语言模型的开源智能商业智能工具。它旨在通过自然语言交互,使用户能够高效地查询、分析和可视化数据。该项目基于LangGraph和LangChain生态系统构建,提供集成式聊天机器人和工作流功能,可实现自然语言到SQL的转换,显著简化了复杂的数据分析流程,提升了数据洞察的效率和可访问性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #网页应用 #数据可视化


🏵 Voilà - Jupyter笔记本网页化工具

🍥 简介:
Voilà 是一个开源工具,能将 Jupyter 笔记本快速转换为独立的交互式网页应用。它通过为每个访问用户分配独立的 Jupyter 内核,支持实时响应网页控件交互并执行回调计算,同时默认隐藏代码单元格以保障安全性。该工具有效解决了传统静态HTML导出无法保持动态交互的问题,让数据分析结果能以更友好、安全的方式直接部署为原型系统或演示界面,大幅降低从分析到产品化的技术门槛。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库开发 #ORM框架


🏵 Ormin - Nim语言轻量ORM

🍥 简介:
Ormin 是专为 Nim 语言设计的轻量级 ORM 框架,支持编译期 SQL 校验、自动生成预编译语句,并提供简洁的 Nim 风格查询 DSL。其核心特性包括类型安全、表结构与字段名校验、自动生成表关联 Join、直接支持 JSON 数据,无需显式转换。Ormin 通过宏自动将 SQL 表结构导入为 Nim 类型,支持 SQLite 和 PostgreSQL 后端,并能在编译期输出生成的 SQL,方便调试。适用于需要高性能、安全性和强类型数据库操作的 Nim 项目。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据处理框架 #AI工具


🏵 CocoIndex - 高性能AI数据变换框架

🍥 简介:
CocoIndex 是一款专为 AI 场景设计的高性能数据处理与变换框架,核心引擎采用 Rust 编写,支持增量式处理和数据血缘追踪。开发者只需用简洁的数据流声明方式,即可灵活实现文本、图片、代码等多类型数据的切分、嵌入、转换和导出,适用于知识图谱构建、向量检索、文本嵌入等多种AI应用。支持本地、云端多种数据源与目标库,内置丰富算子和插件,极大提升数据处理效率与可维护性,开箱即用,适合生产环境和快速研发场景。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Hugging Face AI Sheets - 无代码AI数据处理平台

🍥 简介:
Hugging Face AI Sheets 是一款开源的数据集构建与增强工具,支持通过无代码方式调用多种AI模型,实现数据的生成、处理和转换。用户可直接在网页端操作,或本地/云端部署,灵活对接 Hugging Face Hub 上的数千开源模型,亦支持自定义和本地大模型接入。系统支持简单拖拽、批量推理及自动化脚本扩展,方便快速构建高质量AI数据集,适用于数据标注、NLP、机器学习等多种场景,大幅提升数据工程效率。

🍭 #AI无代码 #数据处理


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Apache Hamilton - 数据流DAG自动化

🍥 简介:
Apache Hamilton 是一款轻量级 Python 库,专注于数据转换有向无环图(DAG)的定义与管理。用户只需用常规 Python 函数声明依赖关系,即可快速构建可移植、可扩展的数据流管道,适用于 ETL、机器学习、LLM 应用与BI分析等场景。它支持自动化DAG生成、可视化追踪、元数据管理和数据校验,提升代码可读性、可测试性和团队协作效率。Hamilton 完全独立于底层运行环境,可无缝集成至本地、Airflow、FastAPI等多种平台。

🍭 #数据工程 #DAG


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Apache Hamilton - 定义可移植的数据流

🍥 简介:
Apache Hamilton 是一个轻量级的 Python 库,用于创建数据转换的有向无环图(DAG)。它帮助数据科学家和工程师定义可测试、模块化、自带文档的数据流,并编码数据血缘与元数据。开发者只需编写常规 Python 函数,通过函数参数指定依赖关系,Hamilton 就能自动为您构建 DAG。其代码可移植性强,能在任何支持 Python 的环境中运行。

🍭 #数据转换 #DAG #Python


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 CSV to HTML Table - CSV转HTML表格

🍥 简介:
CSV to HTML Table 是一个纯 JavaScript 实现的工具,能够将任意 CSV (逗号分隔值) 文件转换成可搜索、可过滤、美观的 HTML 表格。该工具无需后端支持,完全在浏览器端完成转换,方便用户快速将 CSV 数据以易于阅读和操作的方式呈现出来。

🍭 #CSV #HTML #数据展示


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Maxun - 开源无代码网页数据提取

🍥 简介:
Maxun 是一个开源的无代码Web数据提取平台。用户无需编写代码,通过可视化界面训练“机器人”,即可在几分钟内自动抓取网页数据。它能将目标网站转换为API接口或电子表格格式,有效处理分页、滚动加载、登录墙等场景。支持设定计划任务定时执行抓取,并具备适应网站布局变化的能力。提供云托管版本简化部署,也支持本地安装及自带代理(BYOP)配置。

🍭 #数据抓取 #无代码


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Hyperbrowser MCP Server - 网页数据提取与爬取

🍥 简介:
Hyperbrowser MCP Server是Hyperbrowser的MCP服务器实现,提供网页抓取、结构化数据提取和网页爬取等工具。它集成了多种通用浏览器代理,如OpenAI的CUA和Anthropic的Claude Computer Use,方便用户进行自动化操作。主要功能包括:网页内容抓取、多页爬取、HTML到JSON的转换、Bing搜索以及各种浏览器自动化代理。Hyperbrowser API提供更丰富的功能。

🍭 #网页爬虫 #数据提取


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top