GenAI Learner

The Surprising Limits of RL in LLMs: Why Optimization Kills Deep Reasoning Capacity

14 min · 12. marras 2025
jakson The Surprising Limits of RL in LLMs: Why Optimization Kills Deep Reasoning Capacity kansikuva

Kuvaus

The Surprising Limits of RL in LLM Reasoning Arxiv: https://arxiv.org/pdf/2504.13837The promise of RL for LLM growth hits a wall: Tsinghua University's study shows RLVR only improves efficiency but is bounded by and does not elicit novel reasoning in base models—get the non-technical scoop on the "GenAI learner" podcast.

Kommentit

0

Ole ensimmäinen kommentoija

Rekisteröidy nyt ja liity GenAI Learner-yhteisöön!

Aloita nyt

3 kuukautta hintaan 7,99 €

Sitten 7,99 € / kuukausi · Peru milloin tahansa.

  • Podimon podcastit
  • 20 kuunteluaikaa / kuukausi
  • Lataa offline-käyttöön

Kaikki jaksot

29 jaksot