Imagen de portada del espectáculo Practical GCP Podcast by AI

Practical GCP Podcast by AI

Podcast de Richard He

inglés

Tecnología y ciencia

Oferta limitada

2 meses por 1 €

Después 4,99 € / mesCancela cuando quieras.

  • 20 horas de audiolibros / mes
  • Podcasts solo en Podimo
  • Podcast gratuitos
Empezar

Acerca de Practical GCP Podcast by AI

I run a YouTube channel, Practical GCP (https://www.youtube.com/@practicalgcp2780), where I share practical guides for building and deploying data apps on Google Cloud. Some videos are lengthy, so I thought turning popular ones into AI-generated conversational podcasts could be a fun way to learn, especially on the go. Since it’s AI-created, quality may vary, so use it for inspiration and refer back to the original videos for precise details. Enjoy! 🚀

Todos los episodios

1 episodios

Portada del episodio When Cloud Run Meets DeepSeek: Deploying a Powerful Open-Source LLM with GPU Auto-Scaling

When Cloud Run Meets DeepSeek: Deploying a Powerful Open-Source LLM with GPU Auto-Scaling

Tired of wrestling with complex AI model deployments? In this episode, we dive into a game-changing approach to deploying DeepSeek R1—a ChatGPT-level reasoning model—securely and efficiently using Google Cloud Run with Nvidia L4 GPU support. This setup isn’t just experimental; it’s production-ready, scalable, and cost-optimised. Here’s why this matters: 🔹 Production-Grade Simplicity: Skip the DevOps headache. Learn how to package DeepSeek R1 into a 5GB Docker container with Ollama, deploy via Cloud Run, and handle cold starts in just 4–6 seconds. 🔹 GPU Auto-Scaling: Instances scale dynamically with workload, eliminating idle costs. 🔹 Security & Privacy: Your data stays entirely within your cloud environment—no internet access required. We’ll break down the key insights from the original video, including: ✅ Design & Deployment: Why separate application backends from model APIs and step-by-step packaging using Ollama and Cloud Build. ✅ Real-World Demo: See it in action! ✅ Performance & Scalability: Test cases, optimisation attempts, and outcomes. ✅ Cost Analysis: Is it cheaper than ChatGPT? ✅ Key Benefits: Why this setup is a game-changer for AI deployments. This setup stands out because it: 👉 Scales to Zero: Pay nothing when idle—ideal for internal tools or bursty workloads. 👉 Enterprise-Ready: Perfect for B2B/B2C apps requiring privacy, compliance, and low latency. 👉 Future-Proof: Easily swap DeepSeek R1 for other open-source models without rearchitecting. If you want to dive deeper, check out the original video for more details: https://www.youtube.com/watch?v=7H6fJVf79o0 Who should listen? 💡 Engineers streamlining AI deployments. 💡 Teams building secure, internal LLM tools. 💡 Cloud architects optimising cost-performance trade-offs. Let’s discuss: Have you tried GPU-backed Cloud Run? How are you balancing open-source models with production demands? Share your thoughts! This podcast description was generated by AI based on the original video. For the full experience, including visuals and detailed demonstrations, visit the original video linked above.

23 de ene de 2025 - 18 min
Regístrate para escuchar
Soy muy de podcasts. Mientras hago la cama, mientras recojo la casa, mientras trabajo… Y en Podimo encuentro podcast que me encantan. De emprendimiento, de salid, de humor… De lo que quiera! Estoy encantada 👍
Soy muy de podcasts. Mientras hago la cama, mientras recojo la casa, mientras trabajo… Y en Podimo encuentro podcast que me encantan. De emprendimiento, de salid, de humor… De lo que quiera! Estoy encantada 👍
MI TOC es feliz, que maravilla. Ordenador, limpio, sugerencias de categorías nuevas a explorar!!!
Me suscribi con los 14 días de prueba para escuchar el Podcast de Misterios Cotidianos, pero al final me quedo mas tiempo porque hacia tiempo que no me reía tanto. Tiene Podcast muy buenos y la aplicación funciona bien.
App ligera, eficiente, encuentras rápido tus podcast favoritos. Diseño sencillo y bonito. me gustó.
contenidos frescos e inteligentes
La App va francamente bien y el precio me parece muy justo para pagar a gente que nos da horas y horas de contenido. Espero poder seguir usándola asiduamente.

Elige tu suscripción

Más populares

Oferta limitada

Premium

20 horas de audiolibros

  • Podcasts solo en Podimo

  • Disfruta los shows de Podimo sin anuncios

  • Cancela cuando quieras

2 meses por 1 €
Después 4,99 € / mes

Empezar

Premium Plus

100 horas de audiolibros

  • Podcasts solo en Podimo

  • Disfruta los shows de Podimo sin anuncios

  • Cancela cuando quieras

Disfruta 30 días gratis
Después 9,99 € / mes

Prueba gratis

Sólo en Podimo

Audiolibros populares

Preguntas frecuentes

Más preguntas y respuestas
Empezar

2 meses por 1 €. Después 4,99 € / mes. Cancela cuando quieras.