Scraping des offres d’emploi Indeed pour signaux d’embauche avec Bright Data & LLMs

Scraping des Offres d’Emploi Indeed pour Signaux d’Embauche avec Bright Data & LLMs

Pour qui est-ce fait ?
Ce workflow est conçu pour les chercheurs d’emploi, freelances, recruteurs, ou outils RH automatisés souhaitant détecter rapidement des opportunités pertinentes à partir d’Indeed. Il est idéal pour filtrer les offres en masse sans y passer des heures, grâce à l’IA.

Problème résolu / Cas d’usage
Rechercher un emploi sur Indeed peut être fastidieux : beaucoup d’annonces, peu de pertinence, et difficile de faire le tri. Ce workflow automatise la collecte, le classement et l’analyse des offres pour repérer rapidement celles qui correspondent réellement à votre profil ou à vos critères.

Ce que fait ce workflow

  • Récupère des offres d’emploi depuis Indeed grâce au scraper Bright Data.

  • Utilise un formulaire simple pour définir les critères de recherche (lieu, poste, pays).

  • Attend la génération d’un snapshot de données depuis Bright Data.

  • Retourne les offres au format JSON structuré.

  • Insère chaque offre dans une feuille Google Sheets selon un modèle préconfiguré.

  • Envoie chaque ligne à un LLM (GPT-4o-mini, Claude, etc.) qui analyse si l’offre correspond à votre profil.

  • Écrit automatiquement OUI / NON dans une colonne dédiée, pour faciliter le tri des offres pertinentes.

Configuration

1. Prérequis techniques

  • Une feuille Google Sheets copiée depuis le modèle fourni.

  • Un compte Bright Data avec dataset + clé API.

  • Une clé API OpenAI (ou autre LLM compatible avec n8n).

  • Une instance n8n auto-hébergée (ou Cloud) avec les bons nœuds actifs.

2. Champs à renseigner dans le formulaire

  • Lieu du poste (ex. : Paris, Miami, Berlin)

  • Mot-clé (ex. : “Growth Marketer”, “UX Designer”, “Python”)

  • Pays (code à deux lettres, ex. : FR, US, DE)

3. Étapes du workflow

  • L’utilisateur envoie une requête via formulaire ou déclenchement planifié.

  • n8n appelle Bright Data avec les paramètres, ex. :

json
[
{
"country": "US",
"domain": "indeed.com",
"keyword_search": "Growth Marketer",
"location": "Miami",
"date_posted": "Last 24 hours"
}
]
  • Le workflow attend la génération du snapshot JSON.

  • Les données sont insérées ligne par ligne dans Google Sheets.

  • Chaque ligne est analysée par un nœud LLM, avec un prompt personnalisé comme :
    “Cette offre d’emploi est-elle adaptée à un profil junior avec 2 ans d’expérience en growth marketing ? Réponds par OUI ou NON.”

4. Résultat final

  • Une colonne “Match IA” est remplie avec les valeurs OUI ou NON.

  • Permet un tri instantané des offres à fort potentiel.

Personnalisation possible

  • Modifier le prompt IA selon votre profil (niveau d’expérience, secteur, conditions).

  • Ajouter une alerte Slack ou e-mail pour les offres jugées pertinentes.

  • Intégrer Airtable ou Notion pour suivre les candidatures envoyées.

  • Filtrer par type de contrat, télétravail, niveau de salaire, etc.

  • Planifier une recherche quotidienne automatisée (via nœud Cron ou calendrier).

Exemple d’utilisation

Entrée utilisateur (via formulaire)

  • Mot-clé : « Growth Marketer »

  • Lieu : « Miami »

  • Pays : « US »

Sortie Sheets (extrait)

Titre de l’offre Entreprise Lieu Match IA
Growth Marketer Junior StartupX Miami OUI
Head of Growth BigCorp Miami NON
Marketing Assistant Freelance Co. Remote OUI