挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #数据库工具 #数据备份 #开源软件


🏵 Portabase - 数据库备份与恢复管理工具

🍥 简介:
Portabase 是一款专注于简化数据库实例备份与恢复流程的专业工具。该程序通过与 Portabase 代理程序进行集成,实现对数据库操作的集中化管理。其设计核心在于确保数据备份过程的高效性与安全性,适用于需要对数据库实例进行标准化维护与灾难恢复的技术环境。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据管理 #开源工具


🏵 Eidos - 可扩展个人数据管理平台

🍥 简介:
Eidos 是一款可扩展的个人数据管理平台。其核心功能是将 SQLite 数据库转换为个人便携式数据库,使用户能够轻松存储和管理各类个人数据。平台设计旨在提供高效的数据检索与访问能力,确保数据的可用性和便捷性,适用于多种个人数据管理场景。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #数据存储


🏵 MemU - AI记忆管理系统

🍥 简介:
MemU使AI系统能摄取对话、文档和媒体,将其转换为结构化记忆,并存储在三级文件系统中。它提供快速嵌入搜索和深度基于LLM的数据检索,支持多种数据类型以及云端或自托管部署,并配有简洁的API。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据抓取 #爬虫框架


🏵 Scrapy - 强大的网站数据提取工具

🍥 简介:
Scrapy 是一款强大的网站数据提取工具,免费且运行稳定。它能够高效处理复杂的爬取任务,并支持同时管理大量请求,在大规模数据抓取场景下展现出卓越的速度和效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据层 #状态管理


🏵 LiveStore - 响应式SQLite数据层


🍥 简介:
LiveStore 是一个强大的应用程序数据层,利用响应式 SQLite 数据库管理数据,并实现设备间即时同步,包括离线模式。它取代了 Redux 等传统状态管理工具,支持以响应式方式查询和更新数据,通过事件溯源(event-sourcing)提供实时同步功能。


🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #备份工具 #数据安全


🏵 Kopia - 跨平台备份工具

🍥 简介:
Kopia是一款跨平台的备份工具,支持Windows、macOS和Linux系统。它提供快速增量备份、端到端加密、客户端数据压缩和去重功能。Kopia内置命令行界面(CLI)和图形用户界面(GUI),旨在高效、安全地管理用户数据备份,确保数据完整性与保密性。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据处理 #Python框架

🏵 Pathway - Python ETL/流处理框架

🍥 简介:
Pathway是Python框架,用于ETL、流处理、实时分析、LLM管道和RAG。它提供Python API,支持机器学习库集成。代码可在开发与生产环境运行,处理批处理和流式数据。同一代码适用于本地开发、CI/CD、批处理作业与数据流处理。

🎈 【进入项目】

🗣 活动线报 | 掘金项目
🍭 #网络爬虫 #数据抓取 #开发框架


🏵 Scrapy - 网页数据抓取框架

🍥 简介:
Scrapy是一个开源的网络爬虫框架,专为从网站高效提取结构化数据而设计。它提供了一整套工具集,用于构建、部署和管理复杂的爬虫项目,实现自动化数据收集。Scrapy支持多平台运行,具备高度可扩展性,并且要求Python 3.10或更高版本作为其运行环境,以确保最佳兼容性和性能。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #密码管理 #数据安全


🏵 R-pass - 本地凭证安全管理

🍥 简介:
R-pass 是一款专为用户设计的密码管理工具,允许将凭证离线存储并完全掌控。该应用采用最先进的加密标准,确保用户数据存储的安全性和完整性。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #网络工具 #数据包处理


🏵 B4 - 网络包处理器,规避DPI

🍥 简介:
B4是一款专业的网络数据包处理器,主要功能是规避深度包检测(DPI)。它通过精确利用Linux内核的Netfilter框架及其队列管理机制,对网络数据包进行细粒度控制。通过优化数据包的处理路径和时序,B4能有效绕过传统DPI系统的检测与干预,提升数据传输的隐蔽性和顺畅性,为用户提供可靠的DPI规避解决方案。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据处理 #数据清洗


🏵 OpenRefine - 数据清洗与整合

🍥 简介:
OpenRefine是一款基于Java的强大数据处理工具。它允许用户在本地计算机的网页浏览器中执行数据加载、分析、清洗、规范化和网络数据扩充等操作。该工具旨在提供一个安全、私密的环境,高效管理和优化数据集。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据处理 #开源项目 #智能代理 #数据分析工具


🏵 Datus - 数据处理智能代理

🍥 简介:
Datus是一款开源数据处理智能代理,旨在为数据系统构建可扩展的上下文。其核心理念是将数据处理范式从传统的“创建数据表和管道”转变为“为分析师和业务用户提供专门的智能代理”,以提升数据管理与利用的效率及灵活性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库工具 #开源项目 #可视化工具

🏵 Ivory - Postgres集群可视化管理

🍥 简介:
Ivory是一款开源软件,专注于简化并可视化Postgres集群的管理与操作。它为Postgres维护人员提供了直观的工具集,以提升数据库集群的运维效率和开发体验。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库 #Datalog #数据版本


🏵 Datahike - 可靠Datalog数据库,兼容Datomic,类Git语义。

🍥 简介:
Datahike是一款基于Datalog模型的可靠数据库系统。其API兼容Datomic,并集成类似Git的版本管理语义。通过持久化数据结构与结构共享机制,Datahike生成不可变的数据库快照。这些快照作为独立的值,支持在任何环境下进行存储、传输及查询操作,全程无需数据锁定或冗余复制,确保数据一致性与访问效率。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #笔记应用 #Git同步 #Markdown编辑器 #数据隐私


🏵 GitJournal - Git同步笔记应用

🍥 简介:
GitJournal是一款基于Git的笔记应用,强调隐私与数据可移植性。所有笔记均采用标准Markdown格式,可包含YAML元数据,并存储于用户自选的Git仓库(如GitHub、GitLab或自定义服务)。此设计便于笔记自托管及通过Git平台同步管理。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据治理 #元数据管理


🏵 Apache Gravitino - 分布式元数据湖

🍥 简介:
Apache Gravitino 是一款高性能、支持地理分布和联邦架构的开源元数据湖,专为大数据和AI资产的统一元数据管理而设计。它能无缝接入Hive、MySQL、HDFS、S3等多种数据源,提供统一的元数据访问与治理能力。通过灵活的连接器架构,Gravitino 支持多区域、多云环境下的元数据同步,具备访问控制、审计、发现等企业级功能。兼容主流查询引擎和多类型资产管理,适合构建现代数据中台和AI治理平台。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据处理 #AI模型训练


🏵 NeMo Curator - 多模态数据高效清洗

🍥 简介:
NeMo Curator 是 NVIDIA 推出的多模态数据预处理和整理工具,专为大模型(LLM)训练数据优化设计。它利用 GPU 加速,支持文本、图片、视频和音频等多种数据类型的去重、质量过滤、分类、语言检测、嵌入生成等任务,能从单机扩展到多节点集群。内置模块化流水线,适配主流数据源和格式,提升数据质量与处理效率,为大规模 AI 和多模态模型训练提供高效可靠的数据支撑。适用于科研、企业和自动化AI数据管道场景。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #效率工具 #数字健康


🏵 DigiPaws - 安卓应用屏蔽助手

🍥 简介:
DigiPaws 是一款开源的安卓应用管理工具,主要帮助用户减少屏幕依赖、提升专注力。它通过屏蔽指定应用、关键词和部分界面(如短视频、评论区等),有效控制分心内容,还能统计应用使用时长,支持桌面小部件展示数据。支持基础模式自定义屏蔽规则,并计划推出趣味化模式,将防沉迷与任务激励结合。所有功能基于无网络权限的无侵入实现,保障用户隐私,适合需要高效管理手机使用时间的用户。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #家谱管理 #数据库工具


🏵 GEDKeeper - 个人家谱数据库管理

🍥 简介:
GEDKeeper 是一款专注于个人家谱数据库管理的软件,支持 GEDCOM 5.5.1 标准,适用于 Windows、Linux、MacOS 及安卓平台。软件界面简洁直观,功能涵盖家谱数据录入、家族树自动生成、多种形式的家谱展示与打印、地理信息集成(支持 Google 地图和 OpenStreetMap)、快速检索与筛选、多媒体资料添加等。支持插件和 Lua 脚本扩展,满足不同用户的个性化需求,非常适合有家谱整理、族谱制作需求的个人及家庭长期使用。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库 #AI助手集成


🏵 MCP ClickHouse Server - ClickHouse集成服务

🍥 简介:
MCP ClickHouse Server 是专为 ClickHouse 数据库打造的中间件服务,支持与各类 AI 助手进行集成。它提供 SQL 查询、数据库和数据表管理等核心功能,确保所有操作只读,保障数据安全。通过内置健康检查接口,实时监控服务状态。支持直接从文件、URL 或数据库等多种数据源查询,无需复杂的ETL流程,极大简化数据分析和应用集成流程。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top