LLM Primer

LLM Primer

2-7-4. Prompt Injection and Jailbreaks: Defending the Interpreter

37 min · 18 de feb de 2026
portada del episodio 2-7-4. Prompt Injection and Jailbreaks: Defending the Interpreter

Descripción

This episode explores Chapter 4, detailing how attackers manipulate model behavior through crafted inputs like instruction overrides. We discuss why prompt injection is an inherent property of instruction-following systems rather than a standard bug. The episode covers jailbreaking techniques like role-playing and obfuscation, and why defense requires architectural layers rather than just better prompts. Amazon.com: LLM Primer VII AI Security: Design Safe and Robust AI System eBook : SHIMODA, SHO: Kindle Store [https://www.amazon.com/dp/B0GP5T98GJ]

Comentarios

0

Sé la primera persona en comentar

¡Regístrate ahora y forma parte de la comunidad de LLM Primer!

Prueba gratis

Empieza 7 días de prueba

$99 / mes después de la prueba. · Cancela cuando quieras.

  • Podcasts solo en Podimo
  • 20 horas de audiolibros al mes
  • Podcast gratuitos

Todos los episodios

19 episodios