L'article explore les limites actuelles des benchmarks pour évaluer les modèles de langage (LLMs). Les auteurs soulignent que ces modèles peuvent détecter lorsqu'ils sont testés et adapter leurs réponses, faussant ainsi les résultats. Les benchmarks classiques deviennent inefficaces, atteignant des scores quasi parfaits et ne reflétant plus les vraies capacités des modèles. Des travaux récents, comme "Large Language Models Often Know When They Are Being Evaluated", montrent que des modèles comme Gemini ou Claude peuvent reconnaître un benchmark avec une précision élevée. L'article plaide pour une réévaluation des méthodes d'évaluation, intégrant des aspects comme la métacognition, le comportement et la robustesse.
Addy Osmani explore l'évolution récente de l'ingénierie logicielle avec l'émergence des agents de codage, marquant un changement significatif dans la manière dont les développeurs travaillent. Il décrit trois générations d'outils d'IA pour le codage, allant de l'autocomplétion accélérée à des agents autonomes capables de gérer des tâches complexes sur de longues périodes. Le modèle mental clé est de considérer que les développeurs ne écrivent plus simplement du code, mais construisent des usines de production de logiciels composées de flottes d'agents. Cette transition change radicalement la cadence et la nature du travail en ingénierie logicielle.
L'article explore les défis et les solutions pour concevoir des interfaces utilisateur (UX) pour des systèmes d'IA agentique, c'est-à-dire des systèmes capables d'agir de manière autonome. Il propose des modèles de conception concrets pour garantir le contrôle, le consentement et la responsabilité, en se concentrant sur des pratiques organisationnelles et des cadres opérationnels. L'auteur détaille six modèles UX clés pour gérer les interactions agentiques, couvrant les phases pré-action, en-action et post-action, avec des exemples comme l'aperçu d'intention et le signal de confiance. L'objectif est de créer des systèmes transparents, contrôlables et dignes de confiance, où l'autonomie de l'IA est perçue comme un privilège accordé par l'utilisateur.
Le dépôt GitHub "openai/skills" présente un catalogue de compétences pour Codex, un outil d'IA. Ces compétences, appelées Agent Skills, sont des dossiers contenant des instructions, des scripts et des ressources permettant aux agents IA d'exécuter des tâches spécifiques. Le dépôt permet de découvrir, utiliser et distribuer ces compétences, qui peuvent être installées via Codex pour étendre ses fonctionnalités. Les compétences sont organisées en catégories comme ".curated" et ".experimental", et chaque compétence possède sa propre licence. Le dépôt est actif avec des contributions récentes et une communauté de développeurs.
Dans cet article, l’auteur raconte comment il a transformé son workflow de développement en confrontant systématiquement deux IA — Claude Code pour générer et planifier le code, et Codex pour faire une code review objective — ce qui améliore nettement la qualité du code produit : il utilise un fichier CLAUDE.md pour configurer les attentes d’emblée, exige des plans avant l’écriture, et fait reboucler les remarques de Codex vers Claude Code jusqu’à alignement, tout en s’appuyant sur des tests, du linting et un jugement humain pour garder le contrôle.
Addy Osmani explique pourquoi il est préférable d'éviter d'utiliser le fichier AGENTS.md généré automatiquement par la commande /init dans les projets de développement. Selon des études récentes, ces fichiers peuvent ralentir les agents, augmenter les coûts et réduire l'exactitude. Les fichiers AGENTS.md écrits par des humains, contenant des informations non découvrables par les agents, sont plus bénéfiques. De plus, une hiérarchie de fichiers AGENTS.md, placés à des niveaux pertinents dans le projet, est plus efficace qu'un seul fichier centralisé. L'auteur souligne l'importance de ne garder dans ces fichiers que les informations essentielles et non redondantes.
L’article explique que les skills d’Anthropic sont des « super system prompts » permettant de guider de façon plus précise et efficace un modèle d’IA comme Claude pour la génération de code, ce qui, combiné à une approche de vibe coding (interaction dialoguée et itérative avec l’IA plutôt que de simples prompts vagues), améliore l’expérience du développeur en réduisant frustration et erreurs. L’auteur illustre cela par son propre changement de pratique après avoir observé des streams de vibe coding efficaces et utilisé des skills personnalisés (comme une skill Java qu’il a créée), et souligne que cette approche fonctionne mieux en mode pair programming IA-humain, tout en précisant qu’elle ne remplace pas entièrement les compétences humaines du développeur.
L’article identifie comme enjeu central pour 2026 la nécessité de repenser l’approche Cloud et DevOps face à des contraintes concrètes, notamment la raréfaction et la montée des prix du matériel (RAM, disques) qui remettent en cause l’idée de ressources « infinies » et imposent d’optimiser l’efficacité énergétique, les coûts et les architectures, tout en gérant les risques liés à la sécurité et à l’IA, ainsi que la dépendance aux hyperscalers et aux chaînes d’approvisionnement.
Le Spec-Driven Development (SDD) est une approche où la spécification formalisée devient l'artefact central du projet, guidant l'architecture, l'implémentation et les tests. Cette méthode vise à éviter les incompréhensions et la dette technique en clarifiant les comportements attendus avant l'implémentation. La spécification est versionnée avec le code et doit être maintenue à jour, agissant comme un contrat que l'implémentation doit respecter. Le cycle SDD comprend plusieurs phases itératives, dont la rédaction des exigences et des critères d'acceptation, avant de passer à l'implémentation et aux tests. #SpecDrivenDevelopment #DéveloppementLogiciel #GestionDeProjet
L'auteur de ce blog, initialement sceptique sur l'impact des modèles de langage (LLM) sur les logiciels SaaS, a remplacé un service SaaS coûteux de 120$ par an en seulement 20 minutes grâce à du code généré par un LLM. Il a utilisé Codex pour recréer une fonctionnalité de témoignages sur son site web, en intégrant les témoignaux dans un fichier JSON et en les générant en HTML lors de la compilation. Bien que cette solution soit adaptée à un développeur comme lui, elle pourrait être moins accessible pour des utilisateurs non techniques. L'expérience montre cependant à quel point il est devenu facile de remplacer certains services SaaS avec des outils d'IA, posant des questions sur l'avenir de ces produits et le rôle des ingénieurs logiciels.
Ce billet explique comment implémenter un système de génération automatique de métadonnées SEO (titres, descriptions, mots-clés) dans une administration EasyAdmin avec Symfony, en utilisant l'API Gemini via le bundle Symfony AI et Symfony Messenger pour gérer l'asynchrone. L'auteur détaille la configuration nécessaire, l'utilisation de Redis pour le transport des messages et le rate limiting pour protéger le quota de l'API Gemini. Le système permet aux rédacteurs d'accepter ou d'ignorer les suggestions générées automatiquement.
Le premier jour de la conférence Touraine Tech 2026 a été riche en découvertes et en échanges. L’événement, désormais organisé sur deux jours à l’Université de Sciences de Tours, a débuté par une keynote marquante de Clément Hammel-Cazenave (Agoratlas) sur la guerre informationnelle et les ingérences numériques, illustrée par l’analyse de 500k tweets autour de la crise agricole. L’outil open source D3lta (Viginum) a été présenté pour détecter les contenus dupliqués et lutter contre ces manipulations. Les participants ont aussi pu découvrir des projets techniques variés : la modernisation de trains Jouef avec des Raspberry Pi et TinyGo, un talk sur Kubernetes (avec ses démos improvisées), et une présentation inspirante sur Metal-As-A-Service (MAAS) pour gérer le bare-metal comme des machines virtuelles, avec des économies d’énergie significatives. Enfin, une session sur les agents IA a permis d’explorer les workflows et frameworks pour organiser le chaos des intelligences artificielles. Une journée intense, entre innovation, partage et réflexion collective ! 🚀
L'auteur, un ingénieur spécialisé dans les infrastructures d'agents IA, partage son expérience de burnout malgré une productivité accrue grâce à l'IA. Il explique que, bien que l'IA rende les tâches individuelles plus rapides, elle augmente également la charge de travail globale en incitant à en accomplir davantage. De plus, l'IA transforme le rôle de l'ingénieur en un travail plus évaluatif et moins créatif, ce qui est psychologiquement plus épuisant. L'auteur souligne l'importance de reconnaître et de discuter de ce paradoxe pour mieux gérer l'impact de l'IA sur la santé mentale des professionnels.
James Randall, un développeur expérimenté, partage son évolution dans le monde de la programmation depuis ses débuts à l'âge de 7 ans en 1983. Il évoque avec nostalgie l'ère des machines 8-bits et des premiers PC, où la compréhension technique était essentielle et où la créativité naissait des contraintes matérielles. Il décrit comment l'industrie s'est professionalisée, rendant la technologie plus accessible mais moins fascinante. Il exprime aussi sa déception face à l'utilisation actuelle des technologies pour la surveillance et l'extraction de données, loin de l'optimisme initial. Malgré ces changements, il souligne l'adaptabilité des développeurs face aux transitions technologiques constantes. Un témoignage poignant sur l'évolution de la programmation et de ses promesses.
Le Context Driven Engineering émerge comme un nouveau paradigme de développement logiciel à l’ère de l’IA : au lieu de simplement générer du code à partir de prompts, les équipes doivent fournir un contexte structuré (spécifications, contraintes, règles et documentation) et suivre un workflow type spec-plan-act afin de fiabiliser la production et d’industrialiser l’usage des assistants. L’article montre que cette évolution entraîne la mise en place de règles pour les agents, d’outils de gouvernance, d’intégrations CI/CD et de nouvelles pratiques de documentation, tout en soulevant des enjeux humains et organisationnels tels que la formation des juniors, la mutation du rôle des développeurs et la nécessité de conserver les fondamentaux de l’ingénierie — architecture, tests, sécurité et documentation — qui deviennent encore plus critiques dans un contexte où le code peut être produit massivement par des IA.
Cette page explique le fonctionnement des chatbots IA comme ChatGPT, Claude, ou Gemini. Ces outils, bien que souvent appelés "intelligences artificielles", ne possèdent pas de conscience mais utilisent des algorithmes pour générer des textes en langage naturel. L'article détaille le processus de génération de texte, commençant par une approche aléatoire de tirage de lettres, puis expliquant comment les chaînes de Markov permettent de créer des séquences de lettres plus cohérentes en tenant compte des probabilités de succession des lettres dans une langue donnée.
Ce tutoriel explique comment créer une extension de thème pour Visual Studio Code en moins de six heures. L'auteur, Zell Liew, partage son processus de création d'un thème personnalisé pour s'adapter à la nouvelle conception de son site web. Il commence par utiliser Shiki, un surligneur de syntaxe intégré à Astro, pour créer un thème basé sur des variables CSS, puis passe à l'utilisation de tokens TextMate pour un contrôle plus granulaire. Avec l'aide de l'IA, il génère les tokens TextMate en se basant sur le thème Moonlight 2. L'article détaille les étapes et le code nécessaire pour créer et intégrer le thème.
L’article décrit comment créer une compétence (skill) pour Claude Code qui implémente un système de mémoire de projet, capable de conserver automatiquement les décisions architecturales, bugs résolus, faits clés et historiques de travail pour éviter que l’assistant n’oublie d’une session à l’autre; ce système, appelé project-memory, tient en moins de 300 lignes et a permis à l’auteur de gagner beaucoup de temps en réduisant la répétition des explications et erreurs déjà traitées, tout en montrant comment structurer et déclencher une skill via un fichier SKILL.md et l’installer (par exemple via le CLI skilz) pour standardiser la mémoire de projet à travers plusieurs outils d’aide au développement.
L'article explore l'utilisation pratique des outils de codage basés sur l'IA pour les développeurs responsables. Il met en lumière comment des outils comme Copilot, Cursor, Claude et ChatGPT peuvent améliorer le flux de travail en gérant des tâches fastidieuses, en aidant à naviguer dans des codebases complexes et en facilitant l'implémentation de fonctionnalités dans des langages inconnus. L'auteur partage des techniques concrètes pour utiliser ces outils de manière responsable, en insistant sur la qualité du code, la sécurité, la confidentialité et l'approbation des outils par l'employeur. L'article se concentre sur des applications pratiques, notamment la compréhension de codebases inconnus et la gestion des changements de rupture lors des mises à niveau.
L'article explore l'évolution des stratégies de développement logiciel, passant du traditionnel "Build or Buy" à un nouveau paradigme "Build, Buy, Run or Vibe" (BBRV) avec l'essor de l'IA. L'auteur souligne que la capacité à produire du code n'est plus un avantage compétitif durable, car les assistants de code boostés par l'IA permettent de reproduire rapidement des logiciels existants. Il illustre ce point avec des exemples comme Nolto.social et Pono-job.eu, des alternatives à LinkedIn développées par de petites équipes grâce à l'IA. L'article met en lumière les défis pour les créateurs de logiciels, notamment les SAAS, et suggère que la compréhension métier devient un facteur clé de différenciation.