26677 shaares
Cet article explore le fonctionnement des coding agents, des outils qui combinent un modèle de langage (LLM) avec des capacités supplémentaires via des outils appelables. L'auteur explique comment les LLM, comme GPT ou Claude, génèrent du texte à partir de tokens (unités de traitement facturées), et comment les coding agents optimisent les interactions en utilisant des prompts structurés en conversation et en exploitant le token caching pour réduire les coûts. Un guide technique utile pour comprendre les mécanismes derrière ces assistants IA.