GenAI Learner

The Surprising Limits of RL in LLMs: Why Optimization Kills Deep Reasoning Capacity

14 min · 12 nov 2025
aflevering The Surprising Limits of RL in LLMs: Why Optimization Kills Deep Reasoning Capacity artwork

Beschrijving

The Surprising Limits of RL in LLM Reasoning Arxiv: https://arxiv.org/pdf/2504.13837The promise of RL for LLM growth hits a wall: Tsinghua University's study shows RLVR only improves efficiency but is bounded by and does not elicit novel reasoning in base models—get the non-technical scoop on the "GenAI learner" podcast.

Reacties

0

Wees de eerste die een reactie plaatst

Meld je nu aan en word lid van de GenAI Learner community!

Probeer gratis

Probeer 14 dagen gratis

€ 9,99 / maand na proefperiode. · Elk moment opzegbaar.

  • Podcasts die je alleen op Podimo hoort
  • 20 uur luisterboeken / maand
  • Gratis podcasts

Alle afleveringen

29 afleveringen