Automatisation Google Sheets avec n8n : extraction d'entités
Ce workflow n8n a pour objectif d'extraire des entités à partir d'une page web en utilisant Google Sheets. Il s'adresse principalement aux équipes marketing et aux développeurs qui souhaitent automatiser la collecte de données pertinentes pour améliorer leur stratégie de contenu. Grâce à cette automatisation n8n, vous pouvez facilement récupérer des informations clés à partir d'URLs spécifiques, ce qui vous permet de gagner du temps et d'optimiser vos processus de recherche.
- Étape 1 : Le workflow commence avec un déclencheur de type Webhook, qui permet de recevoir des requêtes HTTP.
- Étape 2 : Ensuite, le nœud 'Get Url' est utilisé pour obtenir le contenu de la page web spécifiée.
- Étape 3 : Une fois le contenu récupéré, le nœud 'Google Entities' envoie une requête à l'API de Google pour analyser le texte et détecter les entités.
- Étape 4 : Les résultats sont ensuite traités par le nœud 'Respond with detected entities', qui renvoie les entités détectées au format souhaité. Enfin, le nœud 'Sticky Note' peut être utilisé pour visualiser les résultats ou pour des annotations supplémentaires. Les bénéfices business de ce workflow incluent une réduction significative du temps passé à extraire manuellement des données, une amélioration de la précision des informations collectées, et une meilleure intégration des données dans vos outils de gestion de projet ou de reporting. En utilisant ce template, votre équipe pourra se concentrer sur des tâches à plus forte valeur ajoutée.
Workflow n8n Google Sheets, extraction de données : vue d'ensemble
Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.
Workflow n8n Google Sheets, extraction de données : détail des nœuds
Inscris-toi pour voir l'intégralité du workflow
Inscription gratuite
S'inscrire gratuitementBesoin d'aide ?{
"id": "4wPgPbxtojrUO7Dx",
"meta": {
"instanceId": "f46651348590f9c7e3e7fe91218ed49590c553ab737d5cc247951397ff85fa93"
},
"name": "Google Page Entity Extraction Template",
"tags": [
{
"id": "hBkrfz3jN0GbUgJa",
"name": "Google Page Entity Extraction Template",
"createdAt": "2025-05-08T23:29:39.011Z",
"updatedAt": "2025-05-08T23:29:39.011Z"
}
],
"nodes": [
{
"id": "8719f1de-2a3e-4c34-9edc-e4b8f993b525",
"name": "Respond to Webhook",
"type": "n8n-nodes-base.respondToWebhook",
"position": [
1240,
-420
],
"parameters": {
"options": {}
},
"typeVersion": 1.1
},
{
"id": "01420fd5-3483-4e74-b9fc-971199898449",
"name": "Google Entities",
"type": "n8n-nodes-base.httpRequest",
"position": [
1020,
-420
],
"parameters": {
"url": "https://language.googleapis.com/v1/documents:analyzeEntities",
"method": "POST",
"options": {},
"jsonBody": "={{ $json.apiRequest }}",
"sendBody": true,
"sendQuery": true,
"sendHeaders": true,
"specifyBody": "json",
"queryParameters": {
"parameters": [
{
"name": "key",
"value": "YOUR-GOOGLE-API-KEY"
}
]
},
"headerParameters": {
"parameters": [
{
"name": "Content-Type",
"value": "application/json"
}
]
}
},
"typeVersion": 4.2
},
{
"id": "5c1c258a-44ed-4d5a-a22d-cddb4df09018",
"name": "Sticky Note",
"type": "n8n-nodes-base.stickyNote",
"position": [
-300,
-700
],
"parameters": {
"color": 4,
"width": 620,
"height": 880,
"content": "# Google Page Entity Extraction Template\n\n## What this workflow does\nThis workflow allows you to extract named entities (people, organizations, locations, etc.) from any web page using Google's Natural Language API. Simply send a URL to the webhook endpoint, and the workflow will fetch the page content, process it through Google's entity recognition service, and return the structured entity data.\n\n### How to use\n1. Replace \"YOUR-GOOGLE-API-KEY\" with your actual Google Cloud API key (Natural Language API must be enabled)\n2. Activate the workflow and use the webhook URL as your endpoint\n3. Send a POST request to the webhook with a JSON body containing the URL you want to analyze: {\"url\": \"https://example.com/page\"}\n4. Review the returned entity analysis with categories, salience scores, and metadata\n\n## Webhook Input Format\nThe webhook expects a POST request with a JSON body in this format:\n```json\n{\n \"url\": \"https://website-to-analyze.com/page\"\n}\n```\n### Response Format\nThe webhook returns a JSON response containing the full entity analysis from Google's Natural Language API, including:\n\nEntity names and types (PERSON, LOCATION, ORGANIZATION, etc.)\nSalience scores indicating entity importance\nMetadata and mentions within the text\nEntity sentiment (if available)"
},
"typeVersion": 1
},
{
"id": "79add9a7-adca-4ce5-8a6a-5fcb75288846",
"name": "Get Url",
"type": "n8n-nodes-base.webhook",
"position": [
360,
-420
],
"webhookId": "2944c8f6-03cd-4ab8-8b8e-cb033edf877a",
"parameters": {
"path": "2944c8f6-03cd-4ab8-8b8e-cb033edf877a",
"options": {},
"httpMethod": "POST",
"responseMode": "responseNode"
},
"typeVersion": 2
},
{
"id": "081a52bc-2da7-44fb-bdc3-4cb73cbf8dd3",
"name": "Get URL Page Contents",
"type": "n8n-nodes-base.httpRequest",
"position": [
580,
-420
],
"parameters": {
"url": "={{ $json.body.url }}",
"options": {}
},
"typeVersion": 4.2
},
{
"id": "dda5ef3d-f031-4dd6-b117-c1f69aa66b63",
"name": "Respond with detected entities",
"type": "n8n-nodes-base.code",
"position": [
800,
-420
],
"parameters": {
"jsCode": "// Clean and prepare HTML for API request\nconst html = $input.item.json.data;\n// Trim if too large (optional)\nconst trimmedHtml = html.length > 100000 ? html.substring(0, 100000) : html;\n\nreturn {\n json: {\n apiRequest: {\n document: {\n type: \"HTML\",\n content: trimmedHtml\n },\n encodingType: \"UTF8\"\n }\n }\n}"
},
"typeVersion": 2
}
],
"active": false,
"pinData": {},
"settings": {
"executionOrder": "v1"
},
"versionId": "432203af-190a-4a89-81d8-f86682a0b63f",
"connections": {
"Get Url": {
"main": [
[
{
"node": "Get URL Page Contents",
"type": "main",
"index": 0
}
]
]
},
"Google Entities": {
"main": [
[
{
"node": "Respond to Webhook",
"type": "main",
"index": 0
}
]
]
},
"Get URL Page Contents": {
"main": [
[
{
"node": "Respond with detected entities",
"type": "main",
"index": 0
}
]
]
},
"Respond with detected entities": {
"main": [
[
{
"node": "Google Entities",
"type": "main",
"index": 0
}
]
]
}
}
}Workflow n8n Google Sheets, extraction de données : pour qui est ce workflow ?
Ce workflow s'adresse aux équipes marketing, aux développeurs et aux analystes de données qui cherchent à automatiser l'extraction d'informations à partir de pages web. Il est adapté aux entreprises de toutes tailles souhaitant optimiser leur processus de collecte de données.
Workflow n8n Google Sheets, extraction de données : problème résolu
Ce workflow résout le problème de la collecte manuelle d'informations à partir de pages web, qui peut être fastidieuse et sujette à des erreurs. En automatisant ce processus, il élimine les frustrations liées à la recherche d'entités pertinentes, réduit le temps de traitement des données et améliore la précision des informations collectées. Les utilisateurs peuvent ainsi obtenir rapidement des résultats concrets et exploitables pour leurs projets.
Workflow n8n Google Sheets, extraction de données : étapes du workflow
Étape 1 : Le workflow est déclenché par un Webhook qui reçoit une requête HTTP.
- Étape 1 : Le nœud 'Get Url' récupère le contenu de la page web spécifiée.
- Étape 2 : Le nœud 'Google Entities' envoie une requête à l'API de Google pour analyser le contenu et détecter les entités.
- Étape 3 : Les résultats sont traités par le nœud 'Respond with detected entities', qui renvoie les entités détectées.
- Étape 4 : Enfin, le nœud 'Sticky Note' permet d'ajouter des annotations ou de visualiser les résultats.
Workflow n8n Google Sheets, extraction de données : guide de personnalisation
Pour personnaliser ce workflow, vous pouvez modifier l'URL dans le nœud 'Get Url' pour cibler une page spécifique. Dans le nœud 'Google Entities', vous pouvez ajuster les paramètres d'analyse selon vos besoins. Pensez également à configurer le nœud 'Sticky Note' pour choisir la couleur et le contenu des annotations. Si vous souhaitez intégrer d'autres outils, vous pouvez ajouter des nœuds supplémentaires pour envoyer les résultats vers des plateformes comme Google Sheets ou Slack. Assurez-vous de sécuriser votre Webhook avec des authentifications appropriées.