新智元报道
编辑:桃子
【新智元导读】强化学习,或许并不能通往AGI终点。Karpathy最新发文提出另一种Scaling范式,像人类一样反思回顾,通过复盘学习取得突破,更多的S形进步曲线等待发现。
Grok 4能站在大模型之巅,全是Scaling强化学习立了大功。
新智元报道
编辑:桃子
【新智元导读】强化学习,或许并不能通往AGI终点。Karpathy最新发文提出另一种Scaling范式,像人类一样反思回顾,通过复盘学习取得突破,更多的S形进步曲线等待发现。
Grok 4能站在大模型之巅,全是Scaling强化学习立了大功。