挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #网络爬虫 #数据抓取 #开发框架


🏵 Scrapy - 网页数据抓取框架

🍥 简介:
Scrapy是一个开源的网络爬虫框架,专为从网站高效提取结构化数据而设计。它提供了一整套工具集,用于构建、部署和管理复杂的爬虫项目,实现自动化数据收集。Scrapy支持多平台运行,具备高度可扩展性,并且要求Python 3.10或更高版本作为其运行环境,以确保最佳兼容性和性能。

🎈 【进入项目】


🗣 活动线报 | 掘金项目
🍭 #浏览器工具 #数据生成


🏵 BrowserForge - 浏览器指纹/请求头模拟生成

🍥 简介:
BrowserForge是一款先进的浏览器指纹与HTTP请求头生成工具。它能高效模拟各类浏览器、操作系统及设备的使用频率,从而生成逼真的数字“足迹”。该工具采用贝叶斯生成网络,确保输出数据与实际网络流量模式高度吻合。其运行速度极快,单次生成仅需0.1-0.2毫秒。BrowserForge设计简洁易用,提供广泛的自定义选项,可精细控制浏览器、操作系统、设备、语言及HTTP版本。项目代码基于类型安全原则开发,确保软件的稳定性和健壮性。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库 #Datalog #数据版本


🏵 Datahike - 可靠Datalog数据库,兼容Datomic,类Git语义。

🍥 简介:
Datahike是一款基于Datalog模型的可靠数据库系统。其API兼容Datomic,并集成类似Git的版本管理语义。通过持久化数据结构与结构共享机制,Datahike生成不可变的数据库快照。这些快照作为独立的值,支持在任何环境下进行存储、传输及查询操作,全程无需数据锁定或冗余复制,确保数据一致性与访问效率。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库运维 #自动化升级


🏵 pgautoupgrade - PostgreSQL自动升级工具

🍥 简介:
pgautoupgrade 是一款用于 PostgreSQL 数据库自动升级的 Docker 镜像工具,能够自动检测现有数据目录的版本并执行无缝升级,支持多版本切换和高效数据迁移。升级完成后自动启动新版本数据库,并清理旧集群数据。该工具极大简化了官方镜像无法线上升级的问题,支持一键“one shot”模式及常见数据库环境,适用于开发和生产环境下的自动化数据库升级与维护,显著提升升级安全性和效率。注意升级前请做好数据备份。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #数据库运维 #结构变更工具


🏵 Spirit - MySQL在线结构变更

🍥 简介:
Spirit 是专为 MySQL 8.0 及以上版本开发的在线表结构变更工具,主打高效和安全的数据迁移。它采用多线程方式加速行复制和 binlog 应用,并支持断点续传,大幅提升大表结构变更的速度和容错性。与传统工具相比,Spirit 动态调整数据块大小、内置变更行去重机制,还能智能判断并使用 INSTANT DDL,实现更快的无锁变更。适合需要频繁进行大规模表结构调整的企业级数据库环境。


🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 Maxun - 开源无代码网页数据提取

🍥 简介:
Maxun 是一个开源的无代码Web数据提取平台。用户无需编写代码,通过可视化界面训练“机器人”,即可在几分钟内自动抓取网页数据。它能将目标网站转换为API接口或电子表格格式,有效处理分页、滚动加载、登录墙等场景。支持设定计划任务定时执行抓取,并具备适应网站布局变化的能力。提供云托管版本简化部署,也支持本地安装及自带代理(BYOP)配置。

🍭 #数据抓取 #无代码


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top