Automatisation de la récupération de données web avec n8n
Ce workflow n8n a pour objectif d'automatiser la récupération et le traitement des données à partir de sites web. Dans un contexte où les entreprises cherchent à optimiser leur veille concurrentielle et à enrichir leurs bases de données, ce workflow permet de collecter des informations pertinentes sur des entreprises, notamment leurs noms et sites web. En utilisant des outils comme Supabase pour la gestion des données et OpenAI pour l'analyse, ce processus devient fluide et efficace. Étape 1 : le déclencheur manuel permet de lancer le workflow à la demande. Étape 2 : le nœud 'Get companies' interroge la base de données Supabase pour récupérer les informations des entreprises. Étape 3 : les nœuds 'Set' et 'Filter' sont utilisés pour préparer et nettoyer les données, en éliminant les doublons et les URLs invalides. Étape 4 : les données sont ensuite agrégées et formatées en Markdown pour une meilleure lisibilité. Étape 5 : enfin, les résultats sont insérés dans Supabase pour un accès futur. Grâce à cette automatisation n8n, les entreprises peuvent réduire le temps consacré à la collecte de données tout en améliorant la qualité des informations recueillies, ce qui se traduit par une meilleure prise de décision.
À qui s'adresse ce workflow ?
Ce workflow s'adresse aux entreprises de taille petite à moyenne, aux équipes marketing et aux analystes de données qui cherchent à automatiser la collecte d'informations sur des concurrents ou des partenaires. Un niveau technique intermédiaire est recommandé pour personnaliser et adapter le workflow à des besoins spécifiques.
Ce que ce workflow résout
Ce workflow résout le problème de la collecte manuelle d'informations sur les entreprises, qui peut être chronophage et sujette à des erreurs. En automatisant ce processus, les utilisateurs peuvent gagner un temps précieux tout en s'assurant que les données sont à jour et fiables. Cela réduit également le risque d'erreurs humaines et permet une analyse plus rapide des données collectées.
Comment ça fonctionne
Étape 1 : le workflow est déclenché manuellement.
- 01Étape 1 : les informations des entreprises sont récupérées via Supabase.
- 02Étape 2 : les données sont préparées et nettoyées pour éliminer les doublons et les URLs invalides.
- 03Étape 3 : les données sont agrégées et formatées en Markdown.
- 04Étape 4 : les résultats finaux sont insérés dans Supabase pour un accès ultérieur.
On adapte ce workflow à votre stack.
CRM, outils internes, briques métier — on connecte tout via n8n et on vous livre une automatisation prête à l'emploi.
Visualisation du workflow n8n
Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.
Importer dans n8n en un clic
Inscris-toi gratuitement pour télécharger le fichier .json, puis fais Import from File dans n8n pour déployer le workflow en quelques secondes.
Inscris-toi gratuitement pour télécharger le workflow et l'importer dans n8n.
Télécharger gratuitementInscription en 30 secondes · Sans CB
Personnaliser ce workflow
Pour personnaliser ce workflow, vous pouvez modifier les paramètres du nœud 'Get companies' pour cibler des tables spécifiques dans Supabase. Il est également possible d'ajuster les conditions des nœuds 'Filter' pour affiner les données récupérées. Si vous souhaitez intégrer d'autres sources de données, vous pouvez ajouter des nœuds supplémentaires pour les interroger. Assurez-vous de sécuriser les accès à votre base de données et de monitorer les performances du workflow pour garantir son bon fonctionnement.
Détail des nœuds n8n
- 01Text
Ce noeud traite des données textuelles en utilisant un workflow Langchain.
- 02URLs
Ce noeud gère les URLs dans un workflow Langchain.
- 03OpenAI Chat Model
Ce noeud interagit avec le modèle de chat OpenAI pour générer des réponses.
- 04JSON Parser
Ce noeud analyse et structure les données JSON selon un schéma défini.
- 05Map company name and website
Ce noeud assigne des noms d'entreprise et des sites web à des variables.
- 06Execute workflow
Ce noeud déclenche manuellement l'exécution d'un workflow.
- 07Get companies
Ce noeud récupère des données d'entreprises à partir d'une base de données Supabase.
- 08Select company name and website
Ce noeud sélectionne les noms d'entreprise et les sites web à partir des données.
- 09Set social media array
Ce noeud crée un tableau pour les réseaux sociaux à partir des données existantes.
- 10Merge all data
Ce noeud fusionne toutes les données provenant de différents noeuds.
- 11Insert new row
Ce noeud insère une nouvelle ligne dans une table de la base de données Supabase.
- 12Convert HTML to Markdown
Ce noeud convertit du contenu HTML en format Markdown.
- 13Sticky Note
Ce noeud crée une note autocollante avec des paramètres de couleur et de taille.
- 14Sticky Note1
Ce noeud crée une seconde note autocollante avec des paramètres de couleur et de taille.
- 15Sticky Note2
Ce noeud crée une troisième note autocollante avec des paramètres de couleur et de taille.
- 16Retrieve URLs
Ce noeud récupère des URLs à partir d'une page HTML en utilisant des valeurs d'extraction.
- 17Split out URLs
Ce noeud sépare les URLs d'un champ spécifique dans les données.
- 18Remove duplicated
Ce noeud élimine les doublons dans les données en fonction de critères définis.
- 19Set domain to path
Ce noeud assigne un domaine à un chemin dans les données.
- 20Filter out invalid URLs
Ce noeud filtre les URLs invalides selon des conditions spécifiées.
- 21Aggregate URLs
Ce noeud agrège les URLs selon des critères définis.
- 22Filter out empty hrefs
Ce noeud filtre les hrefs vides dans les données.
- 23Set domain (text)
Ce noeud assigne un domaine à un texte spécifique.
- 24Add protocool to domain (text)
Ce noeud ajoute un protocole à un domaine sous forme de texte.
- 25Get website (text)
Ce noeud assigne un domaine à une URL.
- 26Sticky Note4
Ce noeud crée une cinquième note autocollante avec des paramètres de taille.
- 27Sticky Note5
Ce noeud crée une sixième note autocollante avec des paramètres de taille.
- 28Sticky Note6
Ce noeud crée une septième note autocollante avec des paramètres de taille.
- 29Sticky Note7
Ce noeud crée une huitième note autocollante avec des paramètres de taille.
- 30Add protocool to domain (URL)
Ce noeud ajoute un protocole à un domaine sous forme d'URL.
- 31Sticky Note8
Ce noeud crée une neuvième note autocollante avec des paramètres de couleur et de taille.
- 32Sticky Note9
Ce noeud crée une dixième note autocollante avec des paramètres de couleur et de taille.
- 33Crawl website
Ce noeud effectue un crawl sur un site web en utilisant Langchain.
Vous n'avez pas besoin de plus de canaux.
Vous avez besoin d'un pilote.
Audit gratuit · 48hGratuitRésultats en 48 hSans engagement
06 17 12 54 284,9Google4,96Sortlist4,3Trustpilot40+ clients B2B