Documentation

Extraction de leads

Découvre comment Emailzing extrait et qualifie automatiquement les leads à partir de LinkedIn en utilisant Google Search et l'IA.

Vue d'ensemble

Le processus d'extraction de leads combine plusieurs technologies pour identifier et qualifier automatiquement les décideurs dans les entreprises ciblées :

  1. Google Custom Search Engine pour trouver les profils LinkedIn
  2. OpenRouter LLM pour qualifier les leads
  3. Airtable/PostgreSQL pour stocker les résultats

Le workflow est limité à 100 requêtes Google gratuites par jour. Tu peux ajuster cette limite dans le nœud SetConfiguration.

1. Créer une Custom Search Engine

  1. Va sur Google Cloud Console

    • Crée un nouveau projet
    • Active l'API Custom Search
    • Dans Credentials, copie ta clé API
  2. Va sur Programmable Search Engine

    • Donne un nom à ton moteur
    • Sélectionne Search entire web
    • Copie la valeur cx

2. Configurer les credentials

Dans le nœud SetConfiguration, configure :

{
  "google_search_api_key": "TA_CLE_API",
  "google_search_cx": "TON_CX",
  "daily_limit": 100
}

Processus d'extraction

1. Sélection des entreprises

Le workflow commence par sélectionner une entreprise non traitée (processed = false) depuis ta base de données.

Champs requis :

  • company : nom de l'entreprise
  • linkedin : URL LinkedIn de l'entreprise
  • workfield : domaine technique (React, Vue, etc.)

2. Vérification de la page LinkedIn

Le nœud CheckLinkedInPage vérifie que la page LinkedIn de l'entreprise existe :

  • Si oui → continue le processus
  • Si non → supprime l'entreprise de la base de données et passe à la suivante

3. Recherche de profils

Le nœud GetEmployeesList utilise Google Search pour trouver les décideurs :

q = "COMPANY_NAME site:linkedin.com/in JOB_TITLES"

Titres recherchés par défaut:

  • CTO, CEO, DSI
  • VP Engineering
  • Engineering Manager
  • Director of Engineering
  • Head of Software/IT
  • Et plus...

La recherche exclut automatiquement les profils juniors/stagiaires pour se concentrer sur les décideurs.

Tu peux modifier les titres recherchés dans le nœud SetConfiguration.

4. Qualification par IA

Le workflow utilise OpenRouter avec le modèle deepseek-r1-distill-qwen-32b (gratuit) pour :

  1. Analyser chaque profil trouvé
  2. Extraire les informations pertinentes :
    • Prénom/Nom
    • Titre exact
    • Langue (FR/EN)
    • URL LinkedIn
  3. Vérifier la cohérence avec l'entreprise ciblée

Format des données extraites :

{
  "first_name": "string",
  "last_name": "string",
  "language": "string",
  "title": "string",
  "company_name": "string",
  "linkedin_profile_url": "string"
}

5. Stockage des leads

Les leads qualifiés sont stockés dans :

  • Airtable : table raw_profiles
  • PostgreSQL : table prospection_raw_profiles

Avec les champs :

  • Informations du lead (nom, titre, etc.)
  • processed : false (pour traitement ultérieur)
  • workfield : technologie ciblée

Optimisation des résultats

Pour maximiser la qualité des leads extraits :

  1. Noms d'entreprises précis

    • Évite les abréviations
    • Utilise le nom légal de l'entreprise
  2. Titres de postes adaptés

    // Dans SetConfiguration
    job_titles: "(CTO OR CEO OR VP Engineering) -intern -junior"
  3. Limite quotidienne

    • Par défaut : 100 requêtes/jour
    • Augmentable via Google Cloud Console (payant)
    • Répartition conseillée : 5-10 leads par entreprise

Le LLM filtre automatiquement les faux positifs et ne garde que les profils pertinents pour ta prospection.

Monitoring

Pour suivre l'efficacité de l'extraction :

  1. Table requests

    • Compte les requêtes Google utilisées
    • Réinitialisation quotidienne automatique
  2. Table companies

    • processed : true quand l'extraction est terminée
    • Permet de suivre la progression
  3. Table raw_profiles

    • Contient tous les leads extraits
    • À traiter dans le workflow de vérification d'emails

La prochaine étape est la vérification des emails pour ces leads.