L’article relate l’expérience de Zenika pour rendre son podcast Zenikast accessible grâce à l’IA, en se concentrant sur la transcription automatique. Initialement testé avec Whisper Transcribe (efficace mais nécessitant des heures de relecture), l’équipe s’est tournée vers Gemini 2.5 Pro via Vertex AI Studio de Google Cloud. Ce modèle, capable de traiter l’audio et de diariser les voix, a permis de générer des transcriptions rapides, fluides et presque exemptes d’erreurs, tout en supprimant les tics de langage pour une lecture plus agréable. L’outil offre aussi une option de grounding pour réduire les hallucinations en s’appuyant sur des sources fiables. Résultat : un gain de temps considérable (de 3-4h à 30 minutes par épisode) et une accessibilité améliorée, avec deux versions disponibles (brute et nettoyée). L’article évoque aussi les perspectives d’automatisation future via des agents IA, soulignant l’importance de l’accessibilité et l’efficacité des solutions basées sur l’IA pour les podcasts.
Hyprnote est une solution 100% locale pour transcrire et résumer vos réunions (Zoom, Teams, Meet) sans dépendre du cloud. Elle utilise un modèle STT (comme Whisper) et un micro-LLM (intégré ou externe) pour générer des comptes-rendus automatiques, le tout en respectant votre vie privée. L’interface simple organise réunions, transcripts et synthèses, avec une intégration native à Obsidian pour les utilisateurs de PKM. Open source et en bêta sur macOS (Windows/mobile à venir), Hyprnote se distingue des outils comme Otter.ai en gardant vos données sur votre machine. Un projet prometteur pour ceux qui veulent efficacité et confidentialité.