Extraction de Données de Facture avec LlamaParse & OpenAI

Extraction de Données de Facture avec LlamaParse & OpenAI

Pour qui est-ce fait ?
Ce workflow est idéal pour les équipes comptables, financières ou administratives qui doivent gérer régulièrement des factures au format PDF. Il convient aussi aux indépendants, PME ou start-ups souhaitant automatiser leur saisie comptable et gagner un temps précieux sur les tâches répétitives.

Problème résolu / Cas d’usage
Ce workflow automatise la lecture et la saisie des factures reçues par e-mail. Plus besoin de recopier à la main les montants, dates ou fournisseurs : l’IA extrait les informations pertinentes de chaque PDF et les stocke automatiquement dans Google Sheets pour un suivi clair et structuré.

Ce que fait ce workflow

  • Surveille une boîte mail dédiée (ex. : factures@votreentreprise.com).

  • Télécharge automatiquement les pièces jointes PDF dès réception d’un nouvel e-mail.

  • Utilise LlamaParse pour convertir les PDF en texte Markdown, même s’ils contiennent des tableaux complexes.

  • Envoie le texte extrait à un modèle LLM (ex. : OpenAI) pour en parser les champs utiles : fournisseur, date, numéro de facture, montant HT/TTC, TVA, etc.

  • Stocke toutes les données extraites dans un tableau Google Sheets.

  • Permet un traitement automatique, rapide et centralisé des factures entrantes.

Configuration

1. Surveillance de la boîte mail

  • Connecter un nœud IMAP ou Gmail dans n8n pour surveiller les nouveaux e-mails entrants.

  • Filtrer uniquement ceux contenant des pièces jointes PDF.

2. Extraction avec LlamaParse

  • Envoyer le fichier PDF à LlamaParse via son API pour obtenir une version Markdown du contenu.

  • (Astuce : LlamaParse est particulièrement performant avec les tableaux et structures complexes.)

3. Analyse IA avec LLM

  • Envoyer le texte extrait à un LLM (comme OpenAI GPT-4) avec un prompt spécifique pour identifier les champs à extraire.

  • Exemple de prompt : « Analyse ce texte et extrait les informations de facture suivantes : numéro, date, fournisseur, montant HT, montant TTC, TVA. Retourne un objet JSON. »

4. Sauvegarde dans Google Sheets

  • Connecter Google Sheets avec les colonnes correspondantes (n° facture, date, fournisseur, HT, TVA, TTC).

  • Chaque facture traitée ajoute une nouvelle ligne dans le tableau.

Personnalisation possible

  • Ajouter une alerte Slack ou e-mail en cas d’erreur ou d’ambiguïté sur les données extraites.

  • Coupler avec Airtable ou un ERP pour aller plus loin dans l’automatisation comptable.

  • Ajouter une vérification humaine ou une validation avant enregistrement définitif.

Exemple d’utilisation
Entrée : Un mail contenant une facture PDF en pièce jointe arrive sur factures@entreprise.com.
Sortie :

json
{
"fournisseur": "SARL Dupont",
"n_facture": "F-2024-187",
"date": "2024-05-30",
"montant_ht": 1200.00,
"tva": 240.00,
"montant_ttc": 1440.00
}

Ces données sont ajoutées automatiquement dans Google Sheets à la bonne ligne.