Goku科技发布SASR训练框架,挑战DeepSeek与OpenAI的AI训练方法

2025年,人工智能领域迎来一项重大突破。中国量化交易基金公司Goku Technologies在顶级AI会议NeurIPS(神经信息处理系统大会)上提交了一篇研究论文,介绍了其开发的全新训练技术——SASR(Step-wise Adaptive Hybrid Training Framework)。该方法被认为可能优于当前主流的AI训练方法,包括DeepSeek和OpenAI采用的技术。

SASR:模仿人类推理的训练框架

Goku Technologies成立于2015年,长期致力于量化交易和人工智能研究。在其提交的论文中,Goku指出,当前流行的AI训练方法,如监督微调(SFT)和强化学习(RL),在提升模型推理能力方面存在局限性。为此,Goku提出了SASR训练框架,旨在通过逐步适应的混合训练策略,模拟人类推理能力的发展过程。

SASR框架的核心理念是将训练过程划分为多个阶段,每个阶段专注于特定的推理任务,从而逐步提高模型的推理能力。这种方法不仅提高了训练效率,还增强了模型在复杂任务中的表现。

DeepSeek和OpenAI的比较

DeepSeek的R1模型以其高效的训练方法和出色的推理能力而闻名。该模型采用了强化学习策略,能够在无需大量标注数据的情况下,自主提升推理能力。然而,Goku的SASR框架在训练过程中引入了更多的人类推理模拟机制,可能在某些复杂任务中表现更优。

OpenAI的GPT系列模型则主要依赖于大规模的监督学习和强化学习相结合的训练方法。虽然这些模型在多个任务中表现出色,但训练成本高昂,且对大量标注数据的依赖性较强。相比之下,Goku的SASR框架在降低训练成本的同时,仍能保持较高的模型性能。

SASR的潜在优势

  1. 模拟人类推理过程:SASR框架通过逐步适应的训练策略,模拟人类从简单到复杂的推理能力发展过程,提高了模型的推理能力。
  2. 降低训练成本:与传统的监督学习方法相比,SASR框架减少了对大量标注数据的依赖,降低了训练成本。
  3. 增强模型泛化能力:通过多阶段的训练策略,SASR框架提高了模型在不同任务中的泛化能力。

未来展望

Goku Technologies的SASR训练框架为AI模型的训练提供了新的思路。通过模拟人类推理过程,SASR有望在提升模型推理能力的同时,降低训练成本。未来,随着更多研究的深入,SASR框架可能在AI领域发挥更大的作用。