Recherche : [RAG] - Les liens de Raphaël

Introduction à l’architecture RAG | Les-Tilleuls.coop

Ce billet introduit l'architecture RAG (Récupération Augmentée par Génération) comme solution aux hallucinations des LLM (Large Language Models). Les hallucinations, résultant du fonctionnement probabiliste des LLM, sont des réponses inventées par l'IA en l'absence de données suffisantes. L'architecture RAG propose de remédier à ce problème en combinant la capacité des LLM à générer du texte avec une base de données fiable et contrôlée. Ainsi, l'IA peut générer des réponses plus précises et sourcées, évitant ainsi les inventions non fondées.

architecture · RAG · base-de-données · LLM

November 13, 2025 at 8:45:40 PM GMT+1 · permalien

·

https://les-tilleuls.coop/blog/introduction-a-larchitecture-rag

·

Développer un agent IA custom | Jérémy Buget

Jérémy Buget partage son retour d’expérience sur la création d’un chatbot IA spécialisé dans l’inclusion socio-professionnelle, en s’appuyant sur un corpus de documents issus de La communauté de l’inclusion. Le projet utilise une architecture locale avec Ollama (modèle gpt-oss:20b), un script de crawling en Node.js pour récupérer les fiches d’information, une base PostgreSQL avec l’extension pgvector pour stocker et indexer les embeddings (768 dimensions) générés via Sentence Transformers (nomic-embed-text-v2-moe). Le chatbot fonctionne en vectorisant les questions utilisateurs, en recherchant les documents pertinents par comparaison vectorielle (similarité cosinus), puis en générant des réponses sourcées via un LLM, le tout encapsulé dans une API FastAPI et une webapp simple. L’objectif était d’explorer l’exploitation de l’IA pour un usage métier précis, en garantissant des réponses fiables et ancrées dans le corpus documentaires. Le code source est disponible sur GitHub. Une démonstration concrète de RAG (Retrieval-Augmented Generation) avec des outils open-source.

chatbot · RAG · Ollama · FastAPI · Postgresql · pgvector · tutoriel

October 21, 2025 at 6:12:34 AM GMT+2 * · permalien

·

https://jbuget.fr/posts/developper-un-chatbot-ia-expert-custom/

·

DevFest Nantes 2025 - Récap des 2 jours

L’auteur partage son retour sur le DevFest Nantes 2025, une première pour lui en tant que participant et conférencier. Au programme : une keynote sur le "techlore" (folklore technologique moderne) par Dasha Ilina, des découvertes sur les trésors méconnus de PostgreSQL (CTE, JSONB, Foreign Data Wrapper…), une réflexion philosophique sur l’IA et la conscience, une analogie ludique entre Factorio et l’ingénierie logicielle, et un side project technique autour de la série Bref. Il a aussi co-animé un talk sur Kubernetes (Limits, QoS, PriorityClasses) avec Quentin Joly, et assisté à des retours d’expérience sur Karpenter/KEDA pour le FinOps et un agent vocal "trouveur de chaussettes" mêlant RAG et LLM. L’ambiance networking et les soirées ont complété une édition riche en échanges et en apprentissages.

conférence · roundup · Postgresql · intelligence-artificielle · Factorio · Kubernetes · FinOps · RAG · résumé

October 17, 2025 at 9:40:49 PM GMT+2 * · permalien

·

https://blog.zwindler.fr/2025/10/17/recap-devfest-nantes-2025/

·

GraphRAG - Augmenter la puissance de votre RAG avec L’intégration Neo4J

L’article présente comment renforcer un système RAG (Retrieval-Augmented Generation) en intégrant Neo4j, une base de données graphe, pour améliorer la pertinence et la précision des réponses générées par un LLM (comme Claude d’Anthropic via AWS Bedrock). L’approche combine le LLM pour extraire et structurer des données semi-structurées (via des prompts ciblés) et Neo4j pour stocker ces données sous forme de graphe, permettant des requêtes complexes et contextualisées. Grâce à LangChain, les questions en langage naturel sont traduites en requêtes Cypher, exploitant ainsi la puissance des relations pré-établies dans Neo4j pour fournir des réponses précises, même sur des données métiers spécifiques. L’auteur souligne aussi l’importance de la sécurité, de la performance, et de l’itération sur les prompts pour optimiser les résultats. Une solution idéale pour des cas d’usage professionnels où la précision et le contexte sont cruciaux.

RAG · Neo4J · LLM · LangChain

October 17, 2025 at 9:23:59 PM GMT+2 * · permalien

·

https://blog.ippon.fr/2025/10/17/deeprag-augmenter-la-puissance-de-votre-rag-avec-lintegration-neo4j/

·

How to Build a Local RAG with DeepSeek-R1, LangChain, and Ollama (Step-by-Step Guide) | GoPenAI

Ce guide explique comment construire un système RAG (Retrieval-Augmented Generation) local pour traiter des PDF en utilisant DeepSeek-R1, LangChain, Ollama et Streamlit. Il met l'accent sur la confidentialité et l'efficacité en effectuant toutes les opérations localement, sans frais d'API récurrents. Le système utilise LangChain pour orchestrer le flux de travail, DeepSeek-R1 pour le raisonnement et la génération de réponses, Ollama pour déployer les modèles localement, ChromaDB pour stocker et récupérer les embeddings de documents, et Streamlit pour une interface utilisateur intuitive. Le guide fournit des instructions étape par étape pour installer les prérequis, configurer le projet, et exécuter l'application, permettant aux utilisateurs de poser des questions sur des documents PDF téléchargés et d'obtenir des réponses précises et rapides.

RAG · DeepSeek · Ollama · Streamlit · intelligence-artificielle · local

July 28, 2025 at 9:58:40 PM GMT+2 * · permalien

·

https://blog.gopenai.com/how-to-build-a-privacy-first-rag-using-deepseek-r1-langchain-and-ollama-c5133a8514dd

·

Symfony & Elasticsearch: Build a RAG-Powered AI for Smarter Response | Medium

L'article explore l'intégration de fonctionnalités d'intelligence artificielle dans les applications, en se concentrant sur deux approches principales : le RAG (Retrieval-Augmented Generation) et le fine-tuning. Le RAG combine la génération de texte avec la recherche d'informations externes pour améliorer la qualité des réponses générées, tandis que le fine-tuning adapte un modèle pré-entraîné à des tâches spécifiques en le réentraînant sur des données spécialisées. L'article détaille les différences entre ces méthodes et propose une implémentation pratique d'un système RAG utilisant Symfony et Elasticsearch. Le processus inclut la création d'embeddings à partir de données, leur stockage dans une base de données vectorielle, et l'utilisation d'un modèle de langage pour générer des réponses contextuelles. Le projet, disponible sur GitHub, permet d'expérimenter avec différents cas d'utilisation et modèles d'embeddings. En conclusion, l'article souligne comment la combinaison de RAG et de fine-tuning peut créer des applications AI plus intelligentes et réactives.

RAG · intelligence-artificielle · fine-tuning · Symfony · Elasticsearch

March 23, 2025 at 8:56:21 PM GMT+1 * · permalien

·

https://medium.com/@bordage.mickael/building-a-rag-powered-ai-with-symfony-and-elasticsearch-e447668e3460

·

Construire un chatbot spécialisé sur vos données grâce à l'IA générative et PHP - JoliCode

Tout est dans le titre

chatbot · RAG

October 27, 2024 at 9:50:01 PM GMT+1 * · permalien

·

https://jolicode.com/blog/construire-un-chatbot-specialise-sur-vos-donnees-grace-a-lia-generative-et-php

·

Maîtriser le RAG | Stéphane ROBERT

L'auteur explique l'intérêt de RAG (Retriever-Augmented Generation) par rapport à l'utilisation d'un LLM (Large Language Model) pour créer un chatbot basé sur la documentation technique de son site.

RAG · LLM · intelligence-artificielle

May 11, 2024 at 8:26:57 AM GMT+2 * · permalien

·

https://blog.stephane-robert.info/docs/IA/rag/

·