Aller au contenu
uclic
Workflow n8nManual

Automatisation de la récupération de données web avec n8n

Ce workflow n8n a pour objectif d'automatiser la récupération et le traitement des données à partir de sites web. Dans un contexte où les entreprises cherchent à optimiser leur veille concurrentielle et à enrichir leurs bases de données, ce workflow permet de collecter des informations pertinentes sur des entreprises, notamment leurs noms et sites web. En utilisant des outils comme Supabase pour la gestion des données et OpenAI pour l'analyse, ce processus devient fluide et efficace. Étape 1 : le déclencheur manuel permet de lancer le workflow à la demande. Étape 2 : le nœud 'Get companies' interroge la base de données Supabase pour récupérer les informations des entreprises. Étape 3 : les nœuds 'Set' et 'Filter' sont utilisés pour préparer et nettoyer les données, en éliminant les doublons et les URLs invalides. Étape 4 : les données sont ensuite agrégées et formatées en Markdown pour une meilleure lisibilité. Étape 5 : enfin, les résultats sont insérés dans Supabase pour un accès futur. Grâce à cette automatisation n8n, les entreprises peuvent réduire le temps consacré à la collecte de données tout en améliorant la qualité des informations recueillies, ce qui se traduit par une meilleure prise de décision.

38Nœuds05Intégrations05ÉtapesPrêt à l'emploi
Pour qui

À qui s'adresse ce workflow ?

Ce workflow s'adresse aux entreprises de taille petite à moyenne, aux équipes marketing et aux analystes de données qui cherchent à automatiser la collecte d'informations sur des concurrents ou des partenaires. Un niveau technique intermédiaire est recommandé pour personnaliser et adapter le workflow à des besoins spécifiques.

Le problème

Ce que ce workflow résout

Ce workflow résout le problème de la collecte manuelle d'informations sur les entreprises, qui peut être chronophage et sujette à des erreurs. En automatisant ce processus, les utilisateurs peuvent gagner un temps précieux tout en s'assurant que les données sont à jour et fiables. Cela réduit également le risque d'erreurs humaines et permet une analyse plus rapide des données collectées.

Les étapes

Comment ça fonctionne

Étape 1 : le workflow est déclenché manuellement.

  • 01Étape 1 : les informations des entreprises sont récupérées via Supabase.
  • 02Étape 2 : les données sont préparées et nettoyées pour éliminer les doublons et les URLs invalides.
  • 03Étape 3 : les données sont agrégées et formatées en Markdown.
  • 04Étape 4 : les résultats finaux sont insérés dans Supabase pour un accès ultérieur.
Besoin d'aide

On adapte ce workflow à votre stack.

CRM, outils internes, briques métier — on connecte tout via n8n et on vous livre une automatisation prête à l'emploi.

Schéma visuel

Visualisation du workflow n8n

Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.

JSON n8n

Importer dans n8n en un clic

Inscris-toi gratuitement pour télécharger le fichier .json, puis fais Import from File dans n8n pour déployer le workflow en quelques secondes.

automatisation-de-la-recuperation-de-donnees-web-avec-n8n.json
Réservé membres
JSON complet réservé membres

Inscris-toi gratuitement pour télécharger le workflow et l'importer dans n8n.

Télécharger gratuitement

Inscription en 30 secondes · Sans CB

Guide

Personnaliser ce workflow

Pour personnaliser ce workflow, vous pouvez modifier les paramètres du nœud 'Get companies' pour cibler des tables spécifiques dans Supabase. Il est également possible d'ajuster les conditions des nœuds 'Filter' pour affiner les données récupérées. Si vous souhaitez intégrer d'autres sources de données, vous pouvez ajouter des nœuds supplémentaires pour les interroger. Assurez-vous de sécuriser les accès à votre base de données et de monitorer les performances du workflow pour garantir son bon fonctionnement.

Les nœuds

Détail des nœuds n8n

  • 01
    Text

    Ce noeud traite des données textuelles en utilisant un workflow Langchain.

  • 02
    URLs

    Ce noeud gère les URLs dans un workflow Langchain.

  • 03
    OpenAI Chat Model

    Ce noeud interagit avec le modèle de chat OpenAI pour générer des réponses.

  • 04
    JSON Parser

    Ce noeud analyse et structure les données JSON selon un schéma défini.

  • 05
    Map company name and website

    Ce noeud assigne des noms d'entreprise et des sites web à des variables.

  • 06
    Execute workflow

    Ce noeud déclenche manuellement l'exécution d'un workflow.

  • 07
    Get companies

    Ce noeud récupère des données d'entreprises à partir d'une base de données Supabase.

  • 08
    Select company name and website

    Ce noeud sélectionne les noms d'entreprise et les sites web à partir des données.

  • 09
    Set social media array

    Ce noeud crée un tableau pour les réseaux sociaux à partir des données existantes.

  • 10
    Merge all data

    Ce noeud fusionne toutes les données provenant de différents noeuds.

  • 11
    Insert new row

    Ce noeud insère une nouvelle ligne dans une table de la base de données Supabase.

  • 12
    Convert HTML to Markdown

    Ce noeud convertit du contenu HTML en format Markdown.

  • 13
    Sticky Note

    Ce noeud crée une note autocollante avec des paramètres de couleur et de taille.

  • 14
    Sticky Note1

    Ce noeud crée une seconde note autocollante avec des paramètres de couleur et de taille.

  • 15
    Sticky Note2

    Ce noeud crée une troisième note autocollante avec des paramètres de couleur et de taille.

  • 16
    Retrieve URLs

    Ce noeud récupère des URLs à partir d'une page HTML en utilisant des valeurs d'extraction.

  • 17
    Split out URLs

    Ce noeud sépare les URLs d'un champ spécifique dans les données.

  • 18
    Remove duplicated

    Ce noeud élimine les doublons dans les données en fonction de critères définis.

  • 19
    Set domain to path

    Ce noeud assigne un domaine à un chemin dans les données.

  • 20
    Filter out invalid URLs

    Ce noeud filtre les URLs invalides selon des conditions spécifiées.

  • 21
    Aggregate URLs

    Ce noeud agrège les URLs selon des critères définis.

  • 22
    Filter out empty hrefs

    Ce noeud filtre les hrefs vides dans les données.

  • 23
    Set domain (text)

    Ce noeud assigne un domaine à un texte spécifique.

  • 24
    Add protocool to domain (text)

    Ce noeud ajoute un protocole à un domaine sous forme de texte.

  • 25
    Get website (text)

    Ce noeud assigne un domaine à une URL.

  • 26
    Sticky Note4

    Ce noeud crée une cinquième note autocollante avec des paramètres de taille.

  • 27
    Sticky Note5

    Ce noeud crée une sixième note autocollante avec des paramètres de taille.

  • 28
    Sticky Note6

    Ce noeud crée une septième note autocollante avec des paramètres de taille.

  • 29
    Sticky Note7

    Ce noeud crée une huitième note autocollante avec des paramètres de taille.

  • 30
    Add protocool to domain (URL)

    Ce noeud ajoute un protocole à un domaine sous forme d'URL.

  • 31
    Sticky Note8

    Ce noeud crée une neuvième note autocollante avec des paramètres de couleur et de taille.

  • 32
    Sticky Note9

    Ce noeud crée une dixième note autocollante avec des paramètres de couleur et de taille.

  • 33
    Crawl website

    Ce noeud effectue un crawl sur un site web en utilisant Langchain.

Dernière étape

Vous n'avez pas besoin de plus de canaux.
Vous avez besoin d'un pilote.

Audit gratuit · 48h

GratuitRésultats en 48 hSans engagement

06 17 12 54 284,9Google4,96Sortlist4,3Trustpilot40+ clients B2B