Extraction de Données de Facture avec LlamaParse & OpenAI
Pour qui est-ce fait ?
Ce workflow est idéal pour les équipes comptables, financières ou administratives qui doivent gérer régulièrement des factures au format PDF. Il convient aussi aux indépendants, PME ou start-ups souhaitant automatiser leur saisie comptable et gagner un temps précieux sur les tâches répétitives.
Problème résolu / Cas d’usage
Ce workflow automatise la lecture et la saisie des factures reçues par e-mail. Plus besoin de recopier à la main les montants, dates ou fournisseurs : l’IA extrait les informations pertinentes de chaque PDF et les stocke automatiquement dans Google Sheets pour un suivi clair et structuré.
Ce que fait ce workflow
-
Surveille une boîte mail dédiée (ex. : factures@votreentreprise.com).
-
Télécharge automatiquement les pièces jointes PDF dès réception d’un nouvel e-mail.
-
Utilise LlamaParse pour convertir les PDF en texte Markdown, même s’ils contiennent des tableaux complexes.
-
Envoie le texte extrait à un modèle LLM (ex. : OpenAI) pour en parser les champs utiles : fournisseur, date, numéro de facture, montant HT/TTC, TVA, etc.
-
Stocke toutes les données extraites dans un tableau Google Sheets.
-
Permet un traitement automatique, rapide et centralisé des factures entrantes.
Configuration
1. Surveillance de la boîte mail
-
Connecter un nœud IMAP ou Gmail dans n8n pour surveiller les nouveaux e-mails entrants.
-
Filtrer uniquement ceux contenant des pièces jointes PDF.
2. Extraction avec LlamaParse
-
Envoyer le fichier PDF à LlamaParse via son API pour obtenir une version Markdown du contenu.
-
(Astuce : LlamaParse est particulièrement performant avec les tableaux et structures complexes.)
3. Analyse IA avec LLM
-
Envoyer le texte extrait à un LLM (comme OpenAI GPT-4) avec un prompt spécifique pour identifier les champs à extraire.
-
Exemple de prompt : « Analyse ce texte et extrait les informations de facture suivantes : numéro, date, fournisseur, montant HT, montant TTC, TVA. Retourne un objet JSON. »
4. Sauvegarde dans Google Sheets
-
Connecter Google Sheets avec les colonnes correspondantes (n° facture, date, fournisseur, HT, TVA, TTC).
-
Chaque facture traitée ajoute une nouvelle ligne dans le tableau.
Personnalisation possible
-
Ajouter une alerte Slack ou e-mail en cas d’erreur ou d’ambiguïté sur les données extraites.
-
Coupler avec Airtable ou un ERP pour aller plus loin dans l’automatisation comptable.
-
Ajouter une vérification humaine ou une validation avant enregistrement définitif.
Exemple d’utilisation
Entrée : Un mail contenant une facture PDF en pièce jointe arrive sur factures@entreprise.com.
Sortie :
Ces données sont ajoutées automatiquement dans Google Sheets à la bonne ligne.