挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #数据处理 #Python框架

🏵 Pathway - Python ETL/流处理框架

🍥 简介:
Pathway是Python框架,用于ETL、流处理、实时分析、LLM管道和RAG。它提供Python API,支持机器学习库集成。代码可在开发与生产环境运行,处理批处理和流式数据。同一代码适用于本地开发、CI/CD、批处理作业与数据流处理。

🎈 【进入项目】

🗣 活动线报 | 掘金项目
🍭 #数据工具 #Python库


🏵 Pandas-datareader - 从网络源提取数据

🍥 简介:
Pandas-datareader 是一个 Python 库,用于从各种互联网数据源提取数据。该工具能够将获取的数据直接加载到 pandas DataFrame 结构中,旨在简化数据采集和预处理流程。它为开发者和数据科学家提供了一个高效、标准化的数据获取方案,便于快速集成外部数据进行分析和应用,提升工作效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据库工具 #备份工具 #开源项目


🏵 Databasus - 数据库备份

🍥 简介:
Databasus是一款免费且开源的数据库备份工具,专注于提供自助式数据库备份解决方案,尤其擅长处理PostgreSQL数据库的备份需求。该工具具备灵活的存储选项,允许用户将备份数据安全存储至Amazon S3、Google Drive、FTP等多种云端及本地存储服务。为提升运维效率,Databasus还内置了实时通知系统,支持通过Slack、Discord等平台发送备份任务的进度及完成状态通知,确保用户及时掌握数据库健康状况。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据库工具 #开源项目 #可视化工具

🏵 Ivory - Postgres集群可视化管理

🍥 简介:
Ivory是一款开源软件,专注于简化并可视化Postgres集群的管理与操作。它为Postgres维护人员提供了直观的工具集,以提升数据库集群的运维效率和开发体验。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库 #开发工具

🏵 SpacetimeDB - 数据库服务器一体化

🍥 简介:
SpacetimeDB整合了关系型数据库与应用服务器,允许通过“模块”在数据库内直接执行应用逻辑。客户端可直连数据库,取代传统中间服务器。这种架构简化了开发部署,支持Rust统一构建应用,减少微服务、容器及DevOps复杂性,提高开发运维效率。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库开发 #ORM框架


🏵 Ormin - Nim语言轻量ORM

🍥 简介:
Ormin 是专为 Nim 语言设计的轻量级 ORM 框架,支持编译期 SQL 校验、自动生成预编译语句,并提供简洁的 Nim 风格查询 DSL。其核心特性包括类型安全、表结构与字段名校验、自动生成表关联 Join、直接支持 JSON 数据,无需显式转换。Ormin 通过宏自动将 SQL 表结构导入为 Nim 类型,支持 SQLite 和 PostgreSQL 后端,并能在编译期输出生成的 SQL,方便调试。适用于需要高性能、安全性和强类型数据库操作的 Nim 项目。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库运维 #自动化升级


🏵 pgautoupgrade - PostgreSQL自动升级工具

🍥 简介:
pgautoupgrade 是一款用于 PostgreSQL 数据库自动升级的 Docker 镜像工具,能够自动检测现有数据目录的版本并执行无缝升级,支持多版本切换和高效数据迁移。升级完成后自动启动新版本数据库,并清理旧集群数据。该工具极大简化了官方镜像无法线上升级的问题,支持一键“one shot”模式及常见数据库环境,适用于开发和生产环境下的自动化数据库升级与维护,显著提升升级安全性和效率。注意升级前请做好数据备份。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据处理框架 #AI工具


🏵 CocoIndex - 高性能AI数据变换框架

🍥 简介:
CocoIndex 是一款专为 AI 场景设计的高性能数据处理与变换框架,核心引擎采用 Rust 编写,支持增量式处理和数据血缘追踪。开发者只需用简洁的数据流声明方式,即可灵活实现文本、图片、代码等多类型数据的切分、嵌入、转换和导出,适用于知识图谱构建、向量检索、文本嵌入等多种AI应用。支持本地、云端多种数据源与目标库,内置丰富算子和插件,极大提升数据处理效率与可维护性,开箱即用,适合生产环境和快速研发场景。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库运维 #结构变更工具


🏵 Spirit - MySQL在线结构变更

🍥 简介:
Spirit 是专为 MySQL 8.0 及以上版本开发的在线表结构变更工具,主打高效和安全的数据迁移。它采用多线程方式加速行复制和 binlog 应用,并支持断点续传,大幅提升大表结构变更的速度和容错性。与传统工具相比,Spirit 动态调整数据块大小、内置变更行去重机制,还能智能判断并使用 INSTANT DDL,实现更快的无锁变更。适合需要频繁进行大规模表结构调整的企业级数据库环境。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Reasoning Gym - 推理数据集生成

🍥 简介:
Reasoning Gym 是一个用于生成可程序化验证推理任务数据集的Python库,专为训练和评估推理模型设计,支持强化学习等主流AI训练方式。该项目内置100多种任务类型,涵盖代数、算术、逻辑、图论、认知、计算等多个领域,并能根据参数灵活调整任务难度,实现近乎无限的训练样本生成。提供标准化接口和自动评分机制,便于模型训练和性能对比,适合学术研究及AI模型开发者使用。

🍭 #数据集生成 #推理训练


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 SQLx - 编译时检查的 Rust SQL 工具包

🍥 简介:
SQLx 是一个为 Rust 设计的异步、纯粹的 SQL 工具包。其核心特性是能够在编译时检查原生 SQL 查询的正确性,无需依赖任何 DSL,从而在开发早期就消除潜在的运行时错误,保证了类型安全。它原生支持多种异步运行时(如 Tokio、async-std),并兼容 PostgreSQL、MySQL 和 SQLite 等主流数据库。项目内置了连接池、行流式读取和自动语句缓存等高级功能,是构建高性能、高可靠性数据库应用的理想选择。

🍭 #Rust #数据库


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Apache Hamilton - 定义可移植的数据流

🍥 简介:
Apache Hamilton 是一个轻量级的 Python 库,用于创建数据转换的有向无环图(DAG)。它帮助数据科学家和工程师定义可测试、模块化、自带文档的数据流,并编码数据血缘与元数据。开发者只需编写常规 Python 函数,通过函数参数指定依赖关系,Hamilton 就能自动为您构建 DAG。其代码可移植性强,能在任何支持 Python 的环境中运行。

🍭 #数据转换 #DAG #Python


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top