Mistral Vibe est un assistant de codage en ligne de commande open source développé par Mistral AI, conçu pour interagir avec les projets via une interface conversationnelle en langage naturel. Il permet d'explorer, modifier et gérer un codebase grâce à des outils intégrés comme la manipulation de fichiers, l'exécution de commandes shell ou la recherche de code, tout en s'appuyant sur le contexte du projet (structure des fichiers, statut Git, etc.). L'outil cible principalement les environnements UNIX, bien qu'il soit compatible avec Windows.
L'installation se fait via une commande simple (curl ou uv tool install), et l'assistant propose plusieurs modes d'utilisation : interactif, programmatique ou vocal. Il inclut aussi un système de skills (compétences personnalisables) et des slash commands pour étendre ses fonctionnalités, avec une gestion avancée des sessions et des configurations.
Disponible sous licence Apache 2.0, Mistral Vibe se distingue par son approche modulaire, son intégration avec des modèles comme Mistral Medium 3.5 (pour le multimodal) et ses thèmes personnalisables, tout en garantissant une expérience CLI fluide avec historique et autocomplétion.
Goose est un agent IA open source et extensible conçu pour aller au-delà des simples suggestions de code. Il permet d'installer, d'exécuter, d'éditer et de tester avec n'importe quel grand modèle de langage (LLM), offrant ainsi une interaction plus complète et automatisée.
Le projet se distingue par sa capacité à interagir dynamiquement avec des environnements de développement, en intégrant des outils pour manipuler des fichiers, exécuter des commandes et même interagir avec des plateformes comme Databricks. Il prend en charge Docker et propose des instructions détaillées pour la compilation et l'exécution sur différentes plateformes.
Goose est activement maintenu avec une communauté importante, comptant plus de 48 000 étoiles et 5 200 forks sur GitHub. Le projet inclut également des évaluations de performance, des exemples d'utilisation et une documentation complète pour faciliter la contribution et l'adoption.
L’idée principale de l’article est de proposer une méthode de travail avec deux agents IA pour améliorer la programmation assistée par IA. L’un écrit le code dans un espace de travail dédié, tandis que l’autre, en parallèle, le révise systématiquement après chaque cycle de développement (TDD). Ce second agent, qualifié de « porteur de la lampe », maintient la vision globale du projet et évite que le premier agent ne s’éloigne des objectifs initiaux en se perdant dans les détails techniques.
L’auteur souligne que cette approche simple mais efficace permet de corriger deux problèmes majeurs : d’une part, l’agent codeur peut dériver de la mission initiale en accumulant des décisions localement optimales, et d’autre part, le réviseur identifie les erreurs structurelles ou les choix qui compliquent les étapes suivantes. Contrairement aux sous-agents de révision intégrés, ce réviseur dédié conserve une vision cohérente de l’objectif final tout au long du projet.
Enfin, l’article précise que cette méthode s’ajoute aux outils existants (comme les sous-agents de révision ponctuels) sans les remplacer, car ils remplissent des rôles complémentaires : les sous-agents gèrent les problèmes immédiats, tandis que le réviseur dédié préserve la cohérence globale. Cette coordination entre agents représente une évolution naturelle pour les utilisateurs maîtrisant déjà un agent unique.
L’article aborde la notion de « bon code » dans un contexte où l’IA facilite la génération de code, tout en soulignant que sa qualité reste un enjeu majeur. L’auteur s’appuie sur les travaux de Simon Willison pour définir un code efficace : il doit fonctionner correctement, être validé par des tests et des vérifications, et résoudre un problème réel plutôt qu’un besoin technique mal ciblé. La robustesse face aux erreurs, la simplicité, la documentation à jour et l’évolutivité sont également mises en avant.
L’auteur insiste sur l’importance de gérer les cas d’échec avec des messages exploitables et d’éviter la complexité inutile, tout en respectant des critères non fonctionnels comme la sécurité ou la maintenabilité. Ces principes, valables avant l’ère de l’IA, deviennent encore plus cruciaux avec l’automatisation, car ils garantissent la fiabilité et la pérennité des solutions produites.
Ce dépôt GitHub, soutenu par les équipes de Google Chrome et Microsoft Edge, propose un guide moderne pour le développement web destiné aux agents d'IA. Il vise à les orienter vers des API modernes, performantes et sécurisées plutôt que des solutions obsolètes, en comblant le fossé entre les connaissances des modèles et les bonnes pratiques actuelles.
L'outil, disponible via une commande CLI (npx modern-web-guidance@latest install), fournit des recommandations ciblées et optimisées pour le contexte des agents, couvrant des disciplines comme l'UX, le CSS, les performances ou l'accessibilité. Il inclut 102 fonctionnalités web modernes et 128 cas d'usage concrets, avec des évaluations pour éviter les contenus redondants.
Le projet, encore en version préliminaire, encourage les contributions et retours via GitHub pour enrichir ses guides, notamment sur l'adoption progressive des fonctionnalités et les stratégies de fallback.
Hallmark est un outil conçu pour améliorer les designs générés par IA en évitant l’aspect artificiel et répétitif. Il propose trois fonctionnalités principales : Build pour créer des pages structurées et variées à partir d’une demande, Study pour analyser et extraire la structure d’un design existant, et Audit pour identifier et corriger les anti-patterns courants comme les dégradés de couleurs ou les polices mal assorties.
L’outil se distingue par son approche anti-slop, refusant les solutions génériques et imposant une diversité structurelle grâce à un système de thèmes et de vérifications automatisées. Il permet aussi de redesigner des pages en conservant leur contenu mais en changeant leur structure, pour éviter les répétitions.
Hallmark cible les développeurs et designers utilisant des agents IA comme Claude Code ou Cursor, en offrant une alternative plus qualitative aux générations standardisées. Son catalogue d’anti-patterns et ses exemples concrets illustrent son ambition de produire des designs plus humains et moins reconnaissables comme générés par IA.
L’article explique comment rendre une application Symfony prête pour l’ère des agents IA, en abordant des améliorations comme la négociation Markdown, les signaux de contenu, l’exposition d’API, la documentation OpenAPI et les bases du SEO. L’idée principale est d’adapter les sites web aux interactions avec les agents IA, tout en soulignant que les bonnes pratiques SEO (sécurité, balises, données structurées, etc.) servent de base commune aux deux objectifs.
L’auteur présente ensuite les content signals, une directive robots.txt proposée pour contrôler l’usage du contenu par les IA (entraînement, indexation, entrée pour les modèles). Par défaut, il recommande d’autoriser l’indexation et l’utilisation en entrée pour les outils de recherche, tout en laissant le choix pour l’entraînement, selon les besoins du projet.
Enfin, l’article mentionne des ressources comme isitagentready.com pour évaluer les progrès et propose des outils complémentaires, comme un bundle Symfony et des prompts d’implémentation, bien que l’explication reste générale pour couvrir plusieurs aspects sans entrer dans les détails techniques.
L’auteure relate son expérience à la conférence Google Cloud Next, où l’observabilité des agents IA est devenue un sujet central. Elle souligne l’essor des systèmes autonomes capables d’enchaîner des tâches complexes, tout en pointant un défi majeur : comment diagnostiquer leurs dysfonctionnements, notamment en production nocturne.
Elle explore ensuite l’observabilité appliquée aux serveurs d’inférence comme vLLM, un outil open source populaire pour héberger des modèles IA en local. vLLM intègre des mécanismes de monitoring natifs, permettant de tracer les requêtes, les temps de réponse et les goulots d’étranglement sans instrumentation lourde.
Enfin, elle compare l’observabilité IA à une cuisine de restaurant, illustrant comment suivre l’état des requêtes en temps réel pour identifier les ralentissements ou erreurs. L’objectif est de passer d’une surveillance basique (disponibilité) à une visibilité fine des processus internes, essentielle pour des systèmes de plus en plus complexes.
Ce dépôt GitHub propose des ensembles de règles prêtes à l'emploi pour des assistants IA comme Codex, Cursor ou Claude Code, inspirés d'ouvrages classiques en ingénierie logicielle. Les règles couvrent des thèmes variés comme la conception, l'architecture, le refactoring ou la gestion de données, avec des versions adaptées à différents contextes (mini, nano, full). Chaque ensemble est disponible en Markdown et optimisé pour des outils spécifiques.
Le projet inclut des fichiers de configuration pour une intégration optimale selon l'éditeur utilisé, ainsi que des guides d'utilisation et de critique. Les métriques détaillées (nombre de lignes, de règles, taille des fichiers) permettent de choisir la version la plus adaptée aux contraintes de contexte.
Publié sous licence MIT, ce dépôt vise à standardiser les bonnes pratiques en développement logiciel pour les agents IA, avec une approche modulaire et évolutive.
Les sub-agents de Claude Code permettent d’optimiser les workflows en isolant des tâches spécifiques dans des conversations dédiées, évitant ainsi la saturation du contexte principal. Ils offrent une meilleure gestion des informations en limitant la perte de détails critiques, souvent compressés dans les échanges longs. De plus, ils permettent de choisir des modèles adaptés à chaque sous-tâche et de paralléliser des opérations pour gagner en efficacité.
Concrètement, un sub-agent agit comme un collaborateur autonome : l’agent principal lui délègue une mission (recherche, analyse, correction) via un outil dédié, et ne reçoit en retour qu’un résumé des résultats, sans encombrer son propre contexte. Cette approche réduit la complexité des commandes et améliore la précision des réponses.
Cependant, leur utilisation nécessite une bonne compréhension de leurs limites, comme la gestion des dépendances entre tâches ou la nécessité de structurer clairement les instructions pour éviter les malentendus.
L’idée principale de ce guide est de montrer comment les coding agents (agents capables d’exécuter du code) peuvent améliorer le processus de test manuel pour détecter des problèmes non couverts par les tests automatisés. L’auteur souligne que même si les tests unitaires ou TDD sont utiles, ils ne remplacent pas une vérification humaine, notamment pour des aspects comme l’ergonomie ou des comportements inattendus. Les agents peuvent ainsi exécuter directement du code (via python -c pour Python ou des commandes shell) ou interagir avec des APIs et interfaces web via des outils comme curl ou Playwright, révélant des bugs invisibles aux tests automatisés.
L’auteur détaille des mécanismes concrets pour automatiser ce testing manuel selon le type de projet. Pour les bibliothèques Python, l’exécution directe de code est efficace, tandis que pour les applications web, l’utilisation de requêtes HTTP (curl) ou d’outils de navigation automatisée comme Playwright permet d’explorer les fonctionnalités et de valider leur bon fonctionnement dans un environnement réaliste. Ces méthodes complètent les tests automatisés en identifiant des problèmes liés à l’expérience utilisateur ou à des cas limites non anticipés.
Enfin, l’auteur insiste sur l’importance d’intégrer ces pratiques dans un workflow de développement, en combinant tests automatisés et vérifications manuelles via les agents. Il recommande de corriger les bugs détectés en appliquant une approche red/green TDD pour garantir une couverture permanente, tout en utilisant des outils spécialisés comme agent-browser ou son propre projet Rodney pour simplifier l’automatisation des tests dans des navigateurs réels.
Le Model Context Protocol (MCP) est un standard visant à intégrer des outils et scripts existants directement dans les IDE pour les agents IA. Actuellement, ces agents comprennent le code mais ne peuvent pas exécuter des actions réelles, souvent situées en dehors de l'IDE. MCP propose une solution en exposant ces capacités (CLI, API, services internes) via un contrat structuré, permettant aux agents de les utiliser sans nécessiter de plugins spécifiques. Contrairement aux API REST classiques, MCP standardise les actions et permet une découverte dynamique des capacités, facilitant ainsi l'orchestration par les agents IA.
Dépôt open source proposant une “agence IA” composée d’une cinquantaine d’agents spécialisés organisés par rôles (développement, design, marketing, analyse, etc.), chacun défini par une personnalité, des règles, des workflows et des livrables précis afin d’exécuter des tâches concrètes plutôt que de simples prompts génériques. Le projet fournit plus de 50 agents répartis en plusieurs divisions — par exemple développeur frontend, architecte backend, growth hacker ou responsable Reddit — qui peuvent être combinés pour simuler une équipe complète travaillant sur des projets comme un MVP, une campagne marketing ou une fonctionnalité d’entreprise, avec des processus reproductibles et des critères de réussite mesurables.
L'article décrit comment son travail en ingénierie logicielle a évolué avec l'utilisation d'outils d'IA comme Codex. Il explique que, bien qu'il n'écrive plus de code manuellement, il passe par des étapes rigoureuses de planification, de vérification et de test, en utilisant des agents pour générer des implémentations. Les tâches sont divisées en planification (25-35%), revue et tests (40-50%), et exécution par l'agent (15-25%). Les gains de productivité sont significatifs pour des tâches standard, mais les agents ont encore des limites dans des domaines comme les refactorisations architecturales complexes ou le débogage profond. Les contraintes actuelles incluent les limites de contexte et la dérive architecturale.
L'article propose une nouvelle perspective sur l'intelligence artificielle (IA). Plutôt que de considérer l'IA comme un collègue autonome, l'auteur suggère de la voir comme une exosquelette, un outil qui amplifie les capacités humaines sans les remplacer. En s'appuyant sur des exemples concrets dans les domaines de la fabrication, de l'armée et de la réadaptation médicale, l'article montre comment les exosquelettes augmentent les capacités humaines tout en réduisant les blessures et la fatigue. Cette analogie est utilisée pour critiquer l'approche actuelle de l'IA en tant qu'agent autonome, soulignant que cette vision peut mener à des attentes irréalistes et des déceptions. L'auteur argue que l'IA, comme un exosquelette, devrait être vue comme un amplificateur des capacités humaines, travaillant en synergie avec elles plutôt qu'en remplacement.
Le dépôt GitHub "openai/skills" présente un catalogue de compétences pour Codex, un outil d'IA. Ces compétences, appelées Agent Skills, sont des dossiers contenant des instructions, des scripts et des ressources permettant aux agents IA d'exécuter des tâches spécifiques. Le dépôt permet de découvrir, utiliser et distribuer ces compétences, qui peuvent être installées via Codex pour étendre ses fonctionnalités. Les compétences sont organisées en catégories comme ".curated" et ".experimental", et chaque compétence possède sa propre licence. Le dépôt est actif avec des contributions récentes et une communauté de développeurs.
L'article de Victor Yocco sur Smashing Magazine explore l'émergence de l'IA agentique et son impact sur le design centré sur l'utilisateur. Contrairement à l'automatisation robotique (RPA) qui suit des scripts rigides, l'IA agentique imite le raisonnement humain, planifiant et exécutant des tâches de manière autonome pour atteindre des objectifs. Par exemple, elle peut gérer des conflits de réunion en proposant et confirmant de nouveaux créneaux, ou personnaliser des emails de recrutement. Cette évolution nécessite une nouvelle approche de la recherche UX, axée sur la confiance, le consentement et la responsabilité, pour concevoir des systèmes d'IA agentique responsables et efficaces.
Dans cet article, Hugo Lassiège explore comment l’avènement des agents IA en 2025-2026 bouleverse profondément le rôle traditionnel du développeur : de la simple écriture de code à une responsabilité d’architecte, de superviseur et d’industrialisation des pratiques de production logicielle. À travers une revue des évolutions récentes, il montre que ces assistants autonomes transforment les tâches, élèvent les exigences en rigueur architecturale et ouvrent la voie à une mutation durable du métier plutôt qu’à sa disparition — un débat crucial pour tous les ingénieurs et équipes tech qui doivent anticiper et s’adapter à cette révolution
AGENTS.md est un format ouvert et simple pour guider les agents de codage, utilisé par plus de 60 000 projets open source. Il sert de complément au README.md en fournissant des instructions spécifiques pour les agents, comme les étapes de construction, les tests et les conventions, tout en gardant le README concis et axé sur les contributeurs humains. Le fichier AGENTS.md est compatible avec divers agents de codage et outils, et peut être adopté librement par quiconque trouve cela utile.
L'article explore la méthode Spec-Driven Development (SDD), qui consiste à générer des spécifications détaillées en Markdown avant de coder, guidant ainsi les agents de codage. Bien que prometteuse pour structurer le développement avec l'IA, cette approche, inspirée du modèle Waterfall, présente des inconvénients majeurs : production excessive de texte, bureaucratie systématique, et sentiment de fausse sécurité. L'auteur suggère qu'une approche plus itérative et naturelle pourrait mieux convenir au développement moderne. Plusieurs outils comme Spec-Kit, Kiro, et Tessl sont mentionnés, mais leurs limites sont également discutées.