挖掘有趣 Github 的猫。


有事联系:https://t.me/qumao?direct
🍭 #本地大模型 #推理加速


🏵 Lemonade - 本地LLM高效部署

🍥 简介:
Lemonade 是一款支持本地大语言模型(LLM)推理加速的部署工具,面向 GPU、NPU 和 CPU 硬件自动优化主流推理引擎配置。用户可通过 GUI 或命令行一键安装、拉取模型并启动内置聊天界面,亦可作为 OpenAI 兼容服务与现有应用无缝集成。支持 GGUF、ONNX 等多种模型格式和多平台(Windows、Linux、macOS),内置模型管理、性能测试和内存分析功能,极大简化本地 AI 推理环境搭建,适合开发者和企业灵活扩展 LLM 能力。

🎈 【进入项目】


🗣 羊毛撸货线报 | 合作/投稿
 
 
Back to Top