CIS 5210 - Module 8 - Reinforcement Learning

14 min · 22 de oct de 2024

Descripción

This episode explores reinforcement learning and its relationship to MDPs. Also mentioned: exploration v. exploitation, multi-arm bandits, model-free learning, q-learning. Disclosure: This episode was generated using NotebookLM by uploading Professor Chris Callison-Burch's lecture notes and slides.

Comentarios

Sé la primera persona en comentar

¡Regístrate ahora y únete a la comunidad de The CIS 5210 Podcast!

Prueba gratis

Todos los episodios

8 episodios

CIS 5210 - Module 8 - Reinforcement Learning

22 de oct de 202414 min

CIS 5210 - Module 7 - Markov Decision Processes

This episode explores MDPs, covering stochastic environments, transition functions, reward functions, policies, value iteration, policy iteration, expected utility, finite vs. infinite horizons, discount factors, etc. Disclosure: This episode was generated using NotebookLM by uploading Professor Chris Callison-Burch's lecture notes and slides.

5 de oct de 202416 min

CIS 5210 - Module 6 - Knowledge-Based Agents and Logical Reasoning

This episode explores knowledge-based agents in AI, covering knowledge bases, inference, propositional logic, theorem proving, logical equivalence, resolution, conjunctive normal form (CNF), proof by contradiction, and distributed knowledge representation and reasoning. Disclosure: This episode was generated using NotebookLM by uploading Professor Chris Callison-Burch's lecture notes and slides.

29 de sep de 202413 min

CIS 5210 - Module 5 - CSPs

This episode explores constraint satisfaction problems (CSPs), covering variables, domains, constraints, backtracking search, heuristics, forward checking, constraint propagation, and arc consistency. Disclosure: This episode was generated using NotebookLM by uploading Professor Chris Callison-Burch's lecture notes and slides.

29 de sep de 202411 min

CIS 5210 - Module 4 - Adversarial Search

This episode explores adversarial search in game-playing AI, covering game formulation, minimax, game trees, evaluation functions, alpha-beta pruning and expectimax. Disclosure: This episode was generated using NotebookLM by uploading Professor Chris Callison-Burch's lecture notes and slides.

29 de sep de 202410 min

CIS 5210 - Module 8 - Reinforcement Learning

Descripción

Comentarios

Empieza 7 días de prueba

Todos los episodios