GenAI Learner

The Surprising Limits of RL in LLMs: Why Optimization Kills Deep Reasoning Capacity

14 min · 12. Nov. 2025
Episode The Surprising Limits of RL in LLMs: Why Optimization Kills Deep Reasoning Capacity Cover

Beschreibung

The Surprising Limits of RL in LLM Reasoning Arxiv: https://arxiv.org/pdf/2504.13837The promise of RL for LLM growth hits a wall: Tsinghua University's study shows RLVR only improves efficiency but is bounded by and does not elicit novel reasoning in base models—get the non-technical scoop on the "GenAI learner" podcast.

Kommentare

0

Sei die erste Person, die kommentiert

Melde dich jetzt an und werde Teil der GenAI Learner-Community!

Loslegen

2 Monate für 1 €

Dann 4,99 € / Monat · Jederzeit kündbar.

  • Podcasts nur bei Podimo
  • 20 Stunden Hörbücher / Monat
  • Alle kostenlosen Podcasts

Alle Folgen

29 Folgen