挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #数据处理 #格式转换


🏵 Edit Banana - 统计格式转换框架

🍥 简介:
Edit Banana 是一款专为统计数据格式转换设计的框架。它提供了一套工具和接口,能够高效地将各种统计数据格式解析并转化为可编辑的结构,便于用户进行后续的数据处理、分析与操作。该框架旨在简化数据格式转换的复杂性,提升数据处理的灵活性和效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #AI工具 #数据存储


🏵 MemU - AI记忆管理系统

🍥 简介:
MemU使AI系统能摄取对话、文档和媒体,将其转换为结构化记忆,并存储在三级文件系统中。它提供快速嵌入搜索和深度基于LLM的数据检索,支持多种数据类型以及云端或自托管部署,并配有简洁的API。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据提取 #AI工具


🏵 LangExtract - 提取结构化数据

🍥 简介:
LangExtract 是一个免费的 Python 库。它利用 Gemini 等人工智能模型,从报告、书籍等非结构化文本中提取结构化数据,如人名、情感或药物信息。该库旨在简化数据解析过程,提高数据处理效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #网络爬虫 #数据抓取 #开发框架


🏵 Scrapy - 网页数据抓取框架

🍥 简介:
Scrapy是一个开源的网络爬虫框架,专为从网站高效提取结构化数据而设计。它提供了一整套工具集,用于构建、部署和管理复杂的爬虫项目,实现自动化数据收集。Scrapy支持多平台运行,具备高度可扩展性,并且要求Python 3.10或更高版本作为其运行环境,以确保最佳兼容性和性能。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #数据工具 #Python库


🏵 Pandas-datareader - 从网络源提取数据

🍥 简介:
Pandas-datareader 是一个 Python 库,用于从各种互联网数据源提取数据。该工具能够将获取的数据直接加载到 pandas DataFrame 结构中,旨在简化数据采集和预处理流程。它为开发者和数据科学家提供了一个高效、标准化的数据获取方案,便于快速集成外部数据进行分析和应用,提升工作效率。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #词典工具 #语言资源 #数据集合


🏵 Russian-swears - 俄语脏话词典

🍥 简介:
Russian-swears 是一个专注于俄语脏话的词典项目。该资源结构化地收录了俄语基础脏话词汇、常用前缀、衍生词、固定短语及日常表达。项目还包含实用的参考链接和编辑说明,为研究或分析俄语口语文化提供了一个详细的数据集合。它旨在提供一个全面的俄语俚语和不雅词汇数据库,便于语言学研究、文本分析或其他相关应用。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据分析 #LLM应用


🏵 DeepAnalyze - 首个自主数据分析代理模型

🍥 简介:
DeepAnalyze是首个代理式自主数据分析语言模型,无需人工干预即可执行数据任务。它支持数据准备、分析、建模、可视化及报告生成全流程自动化。该模型能深入分析结构化、半结构化和非结构化等多种数据源,并输出专业分析报告。DeepAnalyze完全开源,用户可自由部署或扩展自定义数据分析助手。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #网页抓取 #自动化 #数据采集


🏵 Scrapling - 自适应网页抓取库

🍥 简介:
Scrapling是一款创新的自适应网页抓取库。不同于传统爬虫,它能智能感知并自动适应目标网站结构的变化。当网站更新导致页面元素布局变动时,Scrapling能自动识别并调整抓取逻辑,确保数据提取任务持续稳定运行,有效避免因网站改版而需频繁维护爬虫代码的问题,提高抓取效率和稳定性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #AI工具 #数据分析 #开源项目


🏵 DeepAnalyze - 自主智能数据分析

🍥 简介:
DeepAnalyze是首个自主数据分析代理模型,能独立完成数据准备、分析、建模、可视化及报告生成等任务。它支持深度分析各类结构化与非结构化数据源,并自动输出专业报告。DeepAnalyze模型、代码、训练数据、演示版均开源,用户可部署或扩展专属分析助手。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库 #Datalog #数据版本


🏵 Datahike - 可靠Datalog数据库,兼容Datomic,类Git语义。

🍥 简介:
Datahike是一款基于Datalog模型的可靠数据库系统。其API兼容Datomic,并集成类似Git的版本管理语义。通过持久化数据结构与结构共享机制,Datahike生成不可变的数据库快照。这些快照作为独立的值,支持在任何环境下进行存储、传输及查询操作,全程无需数据锁定或冗余复制,确保数据一致性与访问效率。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库开发 #ORM框架


🏵 Ormin - Nim语言轻量ORM

🍥 简介:
Ormin 是专为 Nim 语言设计的轻量级 ORM 框架,支持编译期 SQL 校验、自动生成预编译语句,并提供简洁的 Nim 风格查询 DSL。其核心特性包括类型安全、表结构与字段名校验、自动生成表关联 Join、直接支持 JSON 数据,无需显式转换。Ormin 通过宏自动将 SQL 表结构导入为 Nim 类型,支持 SQLite 和 PostgreSQL 后端,并能在编译期输出生成的 SQL,方便调试。适用于需要高性能、安全性和强类型数据库操作的 Nim 项目。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据可视化 #机器学习工具


🏵 Embedding Atlas - 大规模嵌入可视化

🍥 简介:
Embedding Atlas 是一款面向大规模嵌入数据的交互式可视化工具,支持对数百万级别的向量进行聚类、标签自动生成、密度分析和实时搜索。用户可以通过直观的界面探索数据结构,快速定位相似样本及异常点。工具采用 WebGPU 技术,保证高效渲染表现,同时支持多视图联动和元数据筛选。Embedding Atlas 可作为命令行工具、Jupyter Widget 或前端组件集成到 Python、React、Svelte 等开发环境,极大提升嵌入类数据的分析效率和可操作性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库运维 #结构变更工具


🏵 Spirit - MySQL在线结构变更

🍥 简介:
Spirit 是专为 MySQL 8.0 及以上版本开发的在线表结构变更工具,主打高效和安全的数据迁移。它采用多线程方式加速行复制和 binlog 应用,并支持断点续传,大幅提升大表结构变更的速度和容错性。与传统工具相比,Spirit 动态调整数据块大小、内置变更行去重机制,还能智能判断并使用 INSTANT DDL,实现更快的无锁变更。适合需要频繁进行大规模表结构调整的企业级数据库环境。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Hyperbrowser MCP Server - 网页数据提取与爬取

🍥 简介:
Hyperbrowser MCP Server是Hyperbrowser的MCP服务器实现,提供网页抓取、结构化数据提取和网页爬取等工具。它集成了多种通用浏览器代理,如OpenAI的CUA和Anthropic的Claude Computer Use,方便用户进行自动化操作。主要功能包括:网页内容抓取、多页爬取、HTML到JSON的转换、Bing搜索以及各种浏览器自动化代理。Hyperbrowser API提供更丰富的功能。

🍭 #网页爬虫 #数据提取


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🎈 #教程 | Hello,算法 - 数据结构与算法快速入门教程

🎯 简介:
动画图解、能运行、可提问的数据结构与算法快速入门教程。- 动画诠释重点,平滑学习曲线电脑、平板、手机全终端阅读
- 提供经典算法的清晰实现与测试代码多种语言,详细注释,皆可一键运行
- 作者一般 72h 内回复评论问题与小伙伴们一起讨论学习进步
消息源
#算法 #数据结构 #教程 #网页版

📍 【进入网站】


🫥 关注频道 ⛳️ 频道说明 🎯 投稿机器人
 
 
Back to Top