挖掘有趣 Github 的猫。


有事联系:https://t.me/qumaobot
🗣 每日羊毛线报 👈


🏵 Reasoning Gym - 推理数据集生成

🍥 简介:
Reasoning Gym 是一个用于生成可程序化验证推理任务数据集的Python库,专为训练和评估推理模型设计,支持强化学习等主流AI训练方式。该项目内置100多种任务类型,涵盖代数、算术、逻辑、图论、认知、计算等多个领域,并能根据参数灵活调整任务难度,实现近乎无限的训练样本生成。提供标准化接口和自动评分机制,便于模型训练和性能对比,适合学术研究及AI模型开发者使用。

🍭 #数据集生成 #推理训练


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 HRM - 分层推理模型

🍥 简介:
HRM (Hierarchical Reasoning Model) 是一种新型循环神经网络架构,用于解决 AI 中的推理难题。与传统的 Chain-of-Thought (CoT) 方法不同,HRM 模拟人脑的分层和多时间尺度处理,通过高层模块进行抽象规划,低层模块处理详细计算,在单个前向传递中执行序列推理任务,无需显式监督中间过程。仅用 2700 万参数和 1000 个训练样本,HRM 在复杂推理任务上表现出色,无需预训练或 CoT 数据。

🍭 #推理模型 #循环神经网络


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
🗣 每日羊毛线报 👈


🏵 Hierarchical Reasoning Model (HRM) - 高效分层推理模型

🍥 简介:
HRM 是一款受人脑分层处理机制启发的新型循环神经网络架构,专为解决复杂推理任务而设计。它通过一个负责抽象规划的高层模块和一个执行快速计算的低层模块协同工作,在单次前向传播中即可完成复杂任务,无需思维链(CoT)或中间步骤监督。该模型以极高的效率著称,仅用少量参数和训练样本,便能在数独、迷宫寻路等挑战性任务上达到近乎完美的性能,展现了其在通用推理系统领域的巨大潜力。

🍭 #人工智能 #推理模型


🎈 【进入项目】


🎯 关注频道 🤖 合作/投稿
 
 
Back to Top