挖掘有趣 Github 的猫。


有事联系:https://t.me/qumao?direct
🗣 每日羊毛线报 👈


🏵 Skywork-OR1 - 增强数学与代码推理

🍥 简介:
Skywork-OR1 (Open Reasoner 1) 是一个专注于提升大型语言模型在数学和代码领域推理能力的项目。其核心技术是采用基于规则的大规模强化学习(RL),并结合精心设计的数据集与训练流程。该项目发布了一系列模型,包括专精数学的 Skywork-OR1-Math-7B,以及通用推理预览版 Skywork-OR1-7B/32B-Preview。这些模型在数学(如 AIME 基准测试)和代码(如 LiveCodeBench)推理任务上展现出领先性能,部分模型甚至能媲美参数量远超自身的模型。项目已开源模型权重、RL 训练数据及相关代码。

🍭 #大语言模型 #强化学习


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top