趣猫🐱 - 挖掘有趣 Github 的猫。有事联系：https://t.me/qumaobot

挖掘有趣 Github 的猫。

有事联系：https://t.me/qumaobot

13:55 · 2025年12月16日 · 周二

🍭 #多模态AI #语音理解

🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介：
Step-Audio 2是一款工业级端到端多模态大语言模型，专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力，可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术，通过检索文本和音频知识减少幻觉输出，并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平，提供mini、mini Base和mini Think三个开源版本，采用Apache 2.0许可协议。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

多模态AI 语音理解

15:08 · 2025年9月26日 · 周五

🍭 #多模态大模型 #智能推理

🏵 GLM-4.5V/GLM-4.1V-Thinking - 通用视觉语言推理

🍥 简介：
GLM-4.5V 和 GLM-4.1V-Thinking 是新一代视觉语言大模型，支持图像、视频、文档等多模态输入，具备强大的推理与理解能力。模型采用混合训练和强化学习优化，能处理复杂场景下的视觉定位、长文本解析、GUI操作等任务。支持“思考模式”切换，兼顾快速响应与深度推理。产品已开源，配套桌面助手应用和多终端API，便于开发者集成于AI助手、内容分析、智能体等多种应用，实现更智能、全面的多模态交互体验。

🎈 【进入项目】

🗣 羊毛撸货线报 | 合作/投稿

多模态大模型智能推理

07:59 · 2025年9月21日 · 周日

🗣 每日羊毛线报 👈

🏵 anyclaude - 多AI模型Claude集成

🍥 简介：
anyclaude 是一款命令行工具，支持在 Claude Code 环境下无缝调用 OpenAI、Google、xAI 等主流大模型服务商的模型，极大提升模型适配与切换灵活性。工具基于 AI SDK 实现多提供商兼容，支持参数化选择模型、推理强度、服务等级等，适配 GPT-5 及最新模型。配置简单，支持 API Key 直连各家云端服务或自定义端点，适合需要多模型灵活切换与自动化集成的开发者和团队。

🍭 #命令行工具 #多模型集成

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

命令行工具多模型集成

09:08 · 2025年8月6日 · 周三

🗣 每日羊毛线报 👈

🏵 Eigent - 多智能体AI自动化工作平台

🍥 简介：
Eigent 是一款开创性的多智能体桌面应用，旨在帮助用户构建、管理并部署一支定制化的AI工作团队，从而将复杂的工作流程转变为自动化任务。该系统基于知名的开源项目 CAMEL-AI，其核心是让多个具备不同专长（如编程、搜索、文档处理）的AI智能体协同并行工作。Eigent 支持完全开源及本地化部署，保障了数据隐私，同时兼容自定义模型和丰富的外部工具集成，致力于为用户提供前所未有的生产力。

🍭 #多智能体 #AI工作流

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

多智能体 AI工作流

08:01 · 2025年3月28日 · 周五

🗣 每日羊毛线报 👈

🏵 LangManus - 社区驱动的AI自动化框架

🍥 简介：
LangManus 是一个社区驱动的开源 AI 自动化框架，致力于将大型语言模型 (LLM) 与网络搜索、网页抓取、Python 代码执行等专业工具相结合。它通过多智能体协作（如协调器、规划器、研究员、编码器等）来完成复杂自动化任务。该框架支持通过 litellm 集成多种 LLM，内置了 Tavily 搜索、Jina 神经搜索、浏览器控制及 Python 执行环境。项目强调源于开源、回馈开源，并带有学术研究性质，探索多智能体领域。

🍭 #AI自动化 #多智能体

🎈 【进入项目】

🎯 关注频道 🤖 合作/投稿

AI自动化多智能体