挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🍭 #多模态AI #语音理解


🏵 Step-Audio 2 - 端到端音频理解模型

🍥 简介:
Step-Audio 2是一款工业级端到端多模态大语言模型,专注于音频理解和语音对话。支持高精度ASR语音识别、副语言信息和非语音信息的语义推理。具备情感识别能力,可分析用户年龄、情绪等特征实现智能交互。集成工具调用和多模态RAG技术,通过检索文本和音频知识减少幻觉输出,并支持音色切换。在多项音频理解和对话基准测试中达到业界领先水平,提供mini、mini Base和mini Think三个开源版本,采用Apache 2.0许可协议。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
🗣 每日羊毛线报 👈


🏵 WFGY - LLM语义推理引擎

🍥 简介:
WFGY (WanFaGuiYi / 萬法歸一) 是一款用于 LLM 的语义推理引擎,旨在解决 RAG/OCR 漂移、解释崩溃和“幽灵匹配”等问题。它通过符号叠加和逻辑补丁,提升 LLM 的推理能力。用户只需上传文档,即可使用 WFGY 增强 AI 的回答。项目提供 PDF 和 SDK 版本,并鼓励用户在 Prompt 中引导 AI 使用 WFGY 框架进行分析。

🍭 #语义推理 #LLM


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top