26716 shaares
LiteParse est un outil open-source de parsing de documents (PDF, etc.) optimisé pour la vitesse et la légèreté, offrant un parsing spatial précis avec des boîtes de délimitation, sans dépendre du cloud ni de modèles LLM propriétaires. Il prend en charge plusieurs formats de sortie (JSON, texte), l'OCR intégré (Tesseract.js) ou externe (EasyOCR, PaddleOCR), et génère même des captures d'écran. Disponible en binaire autonome ou via npm, il fonctionne hors ligne sur Linux, macOS et Windows. Idéal pour les pipelines locaux, mais pour des documents complexes (tableaux, scans), LlamaParse (version cloud) est recommandé.