挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #多模态AI #语音理解


🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介:
Step-Audio 2是一款工业级端到端多模态大语言模型,专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力,可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术,通过检索文本和音频知识减少幻觉输出,并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平,提供mini、mini Base和mini Think三个开源版本,采用Apache 2.0许可协议。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🍭 #多模态大模型 #智能推理


🏵 GLM-4.5V/GLM-4.1V-Thinking - 通用视觉语言推理

🍥 简介:
GLM-4.5V 和 GLM-4.1V-Thinking 是新一代视觉语言大模型,支持图像、视频、文档等多模态输入,具备强大的推理与理解能力。模型采用混合训练和强化学习优化,能处理复杂场景下的视觉定位、长文本解析、GUI操作等任务。支持“思考模式”切换,兼顾快速响应与深度推理。产品已开源,配套桌面助手应用和多终端API,便于开发者集成于AI助手、内容分析、智能体等多种应用,实现更智能、全面的多模态交互体验。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 anyclaude - 多AI模型Claude集成

🍥 简介:
anyclaude 是一款命令行工具,支持在 Claude Code 环境下无缝调用 OpenAI、Google、xAI 等主流大模型服务商的模型,极大提升模型适配与切换灵活性。工具基于 AI SDK 实现多提供商兼容,支持参数化选择模型、推理强度、服务等级等,适配 GPT-5 及最新模型。配置简单,支持 API Key 直连各家云端服务或自定义端点,适合需要多模型灵活切换与自动化集成的开发者和团队。

🍭 #命令行工具 #多模型集成


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Eigent - 多智能体AI自动化工作平台

🍥 简介:
Eigent 是一款开创性的多智能体桌面应用,旨在帮助用户构建、管理并部署一支定制化的AI工作团队,从而将复杂的工作流程转变为自动化任务。该系统基于知名的开源项目 CAMEL-AI,其核心是让多个具备不同专长(如编程、搜索、文档处理)的AI智能体协同并行工作。Eigent 支持完全开源及本地化部署,保障了数据隐私,同时兼容自定义模型和丰富的外部工具集成,致力于为用户提供前所未有的生产力。

🍭 #多智能体 #AI工作流


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 LangManus - 社区驱动的AI自动化框架

🍥 简介:
LangManus 是一个社区驱动的开源 AI 自动化框架,致力于将大型语言模型 (LLM) 与网络搜索、网页抓取、Python 代码执行等专业工具相结合。它通过多智能体协作(如协调器、规划器、研究员、编码器等)来完成复杂自动化任务。该框架支持通过 litellm 集成多种 LLM,内置了 Tavily 搜索、Jina 神经搜索、浏览器控制及 Python 执行环境。项目强调源于开源、回馈开源,并带有学术研究性质,探索多智能体领域。

🍭 #AI自动化 #多智能体


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top