挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🗣 每日羊毛线报 👈


🏵 c/ua - 高性能AI智能体虚拟化框架

🍥 简介:
c/ua (Computer-Use Agent) 是一款专为 Apple Silicon Mac 设计的框架,旨在让 AI 智能体能够安全地控制运行在高性能虚拟容器内的完整操作系统(macOS/Linux)。它利用 Apple 的 Virtualization.Framework 技术,实现了接近原生(高达 97%)的运行速度。这使得 AI 智能体可以在隔离的环境中执行浏览网页、编写代码、操作应用程序等复杂任务,而无需直接访问宿主机系统。该框架提供了安全隔离、高性能、灵活性和可复现性,并内置了对多种大型语言模型 (LLM) 的集成支持。

🍭 #AI智能体 #虚拟化


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 NoteGen - AI驱动的记录与笔记应用

🍥 简介:
NoteGen 是一款跨平台的 Markdown 笔记应用,其核心设计理念是利用 AI 技术,连接碎片化的信息“记录”与结构化的“写作”过程。用户可以通过截图、文本、文件等多种方式便捷地收集信息片段。随后,借助集成的 AI 能力(支持 ChatGPT、Gemini、Ollama 及自定义模型配置),将这些零散的记录智能地组织、整理成连贯、可读的笔记。应用采用 Markdown 格式进行本地离线存储,同时支持与私有 GitHub 仓库进行实时同步和版本历史回溯,并配备了功能丰富的 Markdown 编辑器。

🍭 #笔记应用 #AI助手


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Plandex - 面向大型项目的AI编程代理

🍥 简介:
Plandex 是一款专为大型项目和复杂实际任务设计的终端 AI 编程代理。它能够规划并执行跨越多个文件、包含多个步骤的编码任务,支持高达 2M Token 的直接上下文处理,并能通过 tree-sitter 索引管理超大规模代码库。其核心特性包括智能上下文管理、用于安全审查 AI 修改的累积差异沙箱,以及可控的命令执行与调试回滚机制。Plandex 支持整合 Anthropic、OpenAI 等多种模型,提供从完全自主到精细控制的可配置工作流,旨在高效、可靠地辅助开发者完成复杂编码工作。

🍭 #AI编程 #大型项目


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Vibe Draw - 手绘草图生成3D模型

🍥 简介:
Vibe Draw 是一款旨在降低 3D 建模门槛的应用,它能将用户随手绘制的粗糙 2D 草图转化为精细的 3D 模型乃至完整的 3D 世界。其核心流程包括:在 2D 画布上自由绘制,利用 AI 增强功能优化草图细节,一键将绘图转换为 3D 模型,并将模型添加到 3D 场景中。用户可通过再次绘制或输入文本提示来迭代修改模型。该项目采用现代 Web 技术栈(Next.js/FastAPI)并集成多种 AI API(如 Claude, Gemini)实现核心转换功能,最终可导出标准的 .glTF 格式文件。

🍭 #3D建模 #AI生成


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 OmniParser - GUI界面结构化解析工具

🍥 简介:
OmniParser 是一款专注于解析用户界面(UI)截图的工具。它能将屏幕图像转化为结构化的元素数据,清晰描述界面上的控件、图标及文本等内容。这种结构化输出极大地提升了大型视觉模型(如 GPT-4V、Qwen-VL)理解 GUI 布局的能力,使其能够更准确地定位界面元素。其核心目标是赋能纯视觉驱动的 AI 代理(Agent),让它们能生成精确映射到屏幕区域的操作指令,实现更可靠的 GUI 自动化交互。结合 OmniTool 可用于控制操作系统。

🍭 #屏幕解析 #GUI自动化


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 抖音弹幕TTS播放器 - 语音播报抖音直播弹幕

🍥 简介:
这是一款简洁的抖音弹幕语音播报工具,基于 saermart 的开源抖音弹幕抓取项目实现。其核心功能是实时捕获指定抖音直播间的弹幕及礼物信息,并利用 TTS (文本转语音) 技术进行语音朗读。该工具提供了简单的图形用户界面 (GUI),支持透明背景设置,方便用户(如主播)将其叠加在直播画面上。用户仅需运行程序并输入直播间 ID 即可轻松使用,实现了对直播互动的即时音频反馈。

🍭 #抖音直播 #弹幕工具


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 SkyReels-V2 - 无限长度影片生成模型

🍥 简介:
SkyReels-V2 是一款开源的无限长度影片生成模型,据称是首个采用自回归扩散强制(AutoRegressive Diffusion-Forcing)架构的开源实现。它旨在解决现有模型在视频时长、动作质量、视觉效果与电影化叙事理解上的瓶颈。该项目融合多模态大语言模型(MLLM)、多阶段预训练、强化学习及扩散强制等技术,并通过自研的 SkyCaptioner-V1 进行精细化视频标注。其目标是生成高质量、长时序、强一致性且符合提示的电影风格视频,支持故事生成、图生视频等应用。

🍭 #视频生成 #AI电影


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Krillin AI - AI视频翻译配音工具

🍥 简介:
Krillin AI 是一款集成 AI 大模型的视频翻译与配音工具。它提供一站式解决方案,涵盖视频下载/上传、基于 Whisper 的高精度字幕生成、LLM 智能字幕分段、专业级翻译、AI 配音(支持声音克隆)及视频合成。该工具可实现一键式全流程处理,自动将视频内容优化并转换为适合 YouTube、TikTok、B站等平台的横屏或竖屏格式,极大简化了视频本地化和跨平台发布流程。

🍭 #视频翻译 #AI配音


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Maxun - 开源无代码网页数据提取

🍥 简介:
Maxun 是一个开源的无代码Web数据提取平台。用户无需编写代码,通过可视化界面训练“机器人”,即可在几分钟内自动抓取网页数据。它能将目标网站转换为API接口或电子表格格式,有效处理分页、滚动加载、登录墙等场景。支持设定计划任务定时执行抓取,并具备适应网站布局变化的能力。提供云托管版本简化部署,也支持本地安装及自带代理(BYOP)配置。

🍭 #数据抓取 #无代码


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Rnote - 矢量绘图与手写笔记

🍥 简介:
Rnote 是一款开源的矢量图形应用程序,专为草图绘制、手写笔记以及文档和图片标注而设计。它采用 Rust 和 GTK4 构建,核心特性包括压感笔优化输入、无限画布、灵活的页面布局、PDF及图片导入/导出(支持SVG、PDF、Xopp等)。提供形状工具、内容选择与变换、工作区文件浏览等功能,旨在为学生、教师及绘图板用户提供高效直观的数字墨水体验。注意其原生文件格式尚不稳定。

🍭 #矢量绘图 #手写笔记


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Giant Log Viewer - 跨平台大文本文件查看器

🍥 简介:
Giant Log Viewer 是一款跨平台的便携式桌面应用程序,旨在解决查看超大文本文件(尤其是日志文件)的难题,特别适用于缺少 less 等命令行工具的环境。其核心特性是极低的内存占用,无论文件大小(从MB到TB级别),都能实现即时加载,仅占用少量固定内存(当前JVM堆限制约80MB)。这使得用户无需担心因文件过大导致内存耗尽或加载缓慢。支持拖放操作和键盘导航。

🍭 #大文件查看 #日志工具


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 DVMCP - MCP协议安全漏洞教学

🍥 简介:
DVMCP (Damn Vulnerable Model Context Protocol) 是一个专为教育目的、故意设计存在安全漏洞的项目。它模拟了一个易受攻击的模型上下文协议(MCP)服务器,包含10个难度递增的安全挑战。这些挑战涵盖了提示注入、工具滥用、权限问题、令牌窃取乃至代码执行等多种攻击向量。其核心目标是帮助安全研究员、开发者和AI安全专家识别、理解并学习如何防范在实际MCP应用中可能遇到的安全风险,提升对LLM相关协议安全的认知。

🍭 #安全漏洞 #MCP


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 LightlyTrain - 自监督视觉模型预训练框架

🍥 简介:
LightlyTrain 是首个专为工业应用设计的 PyTorch 框架,用于在无标签数据上预训练计算机视觉模型。它采用自监督学习技术,让开发者能利用海量的未标注图像或视频数据进行模型预训练,显著减少对昂贵、耗时的人工数据标注的依赖。通过在特定领域数据上预训练,可有效提升模型在下游任务(如分类、检测、分割)中的性能,并加速模型部署。该框架具备良好的扩展性,支持大规模数据集和多GPU环境。

🍭 #自监督学习 #计算机视觉


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Actor Core - 简化状态化应用构建

🍥 简介:
Actor Core 是一个“随处运行的状态化无服务器”框架,旨在极大简化需要管理持久状态的应用开发,例如 AI 代理、实时协作工具或本地优先应用。它通过提供长生命周期的微型计算单元(Actor),这些单元能在多次请求间保持内存状态,无需频繁加载数据或担心超时。状态自动持久化,通常无需外部数据库,且因状态与计算单元共存而实现极低延迟的读写。支持内置的实时事件广播,并可轻松部署到 Rivet、Cloudflare、Node.js 等多种平台。

🍭 #无服务器 #状态管理


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Kernel - Unikernel浏览器环境

🍥 简介:
Kernel 项目提供基于 Unikernel 技术构建的沙盒化 Chrome 浏览器运行环境。它专为需要访问互联网的 AI Agent(智能体)工作流设计,将浏览器置于轻量、安全的 Unikernel 之上。开发者可通过 Chrome DevTools 协议(支持 Playwright、Puppeteer 等框架)对其进行自动化控制,同时提供 noVNC 图形界面用于可视化监控。相比传统容器,其 Unikernel 实现具有自动休眠、状态快照恢复及<20ms极速冷启动等特性,优化了资源利用率和任务响应速度。 [登记Web自动化候补名单]

🍭 #Unikernel #浏览器自动化


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Watermark Segmentation - 图像水印精确分割

🍥 简介:
Watermark Segmentation 是由 DiffusionDynamics.aiclear.photo 开源的项目,专注于图像中水印(如图标、文字)的精确分割。该项目利用深度学习技术,结合 PyTorch 框架与合成数据增强方法,生成准确的水印区域遮罩 (mask)。其代码参考了相关领域的前沿研究,旨在提供一个简洁、可扩展的水印识别基线代码。这是实现高级水印移除(如 clear.photo 所用技术)的关键第一步,代码易于理解和修改,并支持在本地硬件上进行微调。

🍭 #图像处理 #深度学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Skywork-OR1 - 增强数学与代码推理

🍥 简介:
Skywork-OR1 (Open Reasoner 1) 是一个专注于提升大型语言模型在数学和代码领域推理能力的项目。其核心技术是采用基于规则的大规模强化学习(RL),并结合精心设计的数据集与训练流程。该项目发布了一系列模型,包括专精数学的 Skywork-OR1-Math-7B,以及通用推理预览版 Skywork-OR1-7B/32B-Preview。这些模型在数学(如 AIME 基准测试)和代码(如 LiveCodeBench)推理任务上展现出领先性能,部分模型甚至能媲美参数量远超自身的模型。项目已开源模型权重、RL 训练数据及相关代码。

🍭 #大语言模型 #强化学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Meilisearch - 极速搜索引擎API

🍥 简介:
Meilisearch 是一款开源、闪电般快速的搜索引擎 API,专为轻松集成到各类网站和应用程序而设计。它核心优势在于极速的搜索响应(低于50毫秒),提供即时搜索(search-as-you-type)体验。支持AI驱动的混合搜索(结合关键字与语义)、强大的拼写容错、多语言处理、精细的过滤与分面搜索、地理位置搜索及多租户等高级功能。通过RESTful API和丰富的SDK,开发者可以快速构建高性能、用户友好的搜索功能。meilisearch

🍭 #搜索引擎 #全文检索


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Rust CUDA Project - Rust 实现 GPU 高速计算

🍥 简介:
Rust CUDA Project 是一个旨在使 Rust 成为利用 NVIDIA CUDA Toolkit 进行高性能 GPU 计算的一流语言的生态系统。它提供了一整套库和工具,让开发者能完全使用 Rust 编写并执行高效的 GPU 加速代码。该项目致力于解决先前 Rust 编译到 PTX 的技术瓶颈,通过提供专门的编译器后端(如 rustc_codegen_nvvm )生成高度优化的 PTX 代码。其核心库包括用于 GPU 端开发的 cuda_std 和 CPU 端 CUDA 交互的 cust ,同时还封装了 cuDNN、OptiX 等关键 CUDA 库,方便 Rust 开发者利用 GPU 算力。

🍭 #Rust #GPU计算


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
Back to Top