Workflow n8n

Automatisation n8n : filtrage d'URLs depuis un sitemap

Ce workflow n8n a pour objectif de lire un sitemap et de filtrer les URLs qu'il contient, facilitant ainsi la gestion des données pour les entreprises. Dans un contexte où la gestion des informations en ligne est cruciale, ce processus permet aux équipes marketing et techniques de s'assurer qu'elles travaillent avec des données à jour et pertinentes. Par exemple, les agences de communication peuvent utiliser ce workflow pour extraire des liens utiles pour leurs campagnes, tandis que les développeurs peuvent l'intégrer dans leurs processus de mise à jour de contenu.

  • Étape 1 : Le workflow débute par un déclencheur manuel, permettant à l'utilisateur de lancer le processus à tout moment.
  • Étape 2 : Ensuite, l'URL du sitemap est définie à l'aide d'un nœud de configuration.
  • Étape 3 : Le nœud 'Split Out' permet de séparer les données pour un traitement plus facile.
  • Étape 4 : Le nœud 'Get Sitemap' effectue une requête HTTP pour récupérer le contenu du sitemap.
  • Étape 5 : Les données XML sont ensuite converties en JSON, facilitant leur manipulation.
  • Étape 6 : Le nœud 'Filter URLs' applique des conditions pour ne conserver que les URLs pertinentes. Enfin, plusieurs notes autocollantes sont ajoutées pour documenter le processus. Ce workflow offre une valeur ajoutée significative en réduisant le temps de traitement des données et en minimisant les erreurs humaines, ce qui permet aux équipes de se concentrer sur des tâches à plus forte valeur ajoutée.
Tags clés :automatisationworkflowsitemapn8ndata management
Catégorie: Manual · Tags: automatisation, workflow, sitemap, n8n, data management0

Workflow n8n sitemap, data management : vue d'ensemble

Schéma des nœuds et connexions de ce workflow n8n, généré à partir du JSON n8n.

Workflow n8n sitemap, data management : détail des nœuds

  • ‘Test workflow’ trigger

    Ce noeud déclenche manuellement le workflow.

  • Set sitemap URL

    Ce noeud définit l'URL du sitemap à utiliser dans le workflow.

  • Split Out

    Ce noeud permet de séparer les données en fonction d'un champ spécifié.

  • Get Sitemap

    Ce noeud effectue une requête HTTP pour récupérer le sitemap à partir de l'URL fournie.

  • Convert Sitemap to JSON

    Ce noeud convertit le sitemap récupéré au format XML en JSON.

  • Filter URLs

    Ce noeud filtre les URLs en fonction des conditions spécifiées.

  • Sticky Note1

    Ce noeud crée une note autocollante avec les paramètres de couleur, taille et contenu fournis.

  • Sticky Note2

    Ce noeud crée une seconde note autocollante avec des spécifications similaires à la première.

  • Sticky Note3

    Ce noeud génère une troisième note autocollante avec les paramètres définis.

  • Sticky Note

    Ce noeud crée une note autocollante avec des dimensions et un contenu spécifiés.

Inscris-toi pour voir l'intégralité du workflow

Inscription gratuite

S'inscrire gratuitementBesoin d'aide ?
{
  "id": "7fdJOvYNILCr24fH",
  "meta": {
    "instanceId": "568298fde06d3db80a2eea77fe5bf45f0c7bb898dea20b769944e9ac7c6c5a80"
  },
  "name": "Read sitemap and filter URLs",
  "tags": [],
  "nodes": [
    {
      "id": "38910330-5286-4f3f-b62e-9216acccd503",
      "name": "‘Test workflow’ trigger",
      "type": "n8n-nodes-base.manualTrigger",
      "position": [
        -460,
        -60
      ],
      "parameters": {},
      "typeVersion": 1
    },
    {
      "id": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
      "name": "Set sitemap URL",
      "type": "n8n-nodes-base.set",
      "position": [
        -280,
        -60
      ],
      "parameters": {
        "options": {},
        "assignments": {
          "assignments": [
            {
              "id": "d6c5ac86-6d67-42fb-96ec-9826caf452e2",
              "name": "sitemapUrl",
              "type": "string",
              "value": "https://duckduckgo.com/sitemap.xml"
            }
          ]
        }
      },
      "typeVersion": 3.4
    },
    {
      "id": "0d957deb-5830-4077-97e4-437dc7c0e527",
      "name": "Split Out",
      "type": "n8n-nodes-base.splitOut",
      "position": [
        260,
        -60
      ],
      "parameters": {
        "options": {},
        "fieldToSplitOut": "urlset.url"
      },
      "typeVersion": 1
    },
    {
      "id": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
      "name": "Get Sitemap",
      "type": "n8n-nodes-base.httpRequest",
      "position": [
        -100,
        -60
      ],
      "parameters": {
        "url": "={{ $json.sitemapUrl }}",
        "options": {}
      },
      "typeVersion": 4.2
    },
    {
      "id": "d3b86577-01fc-40f8-ab65-93ba420187b8",
      "name": "Convert Sitemap to JSON",
      "type": "n8n-nodes-base.xml",
      "position": [
        80,
        -60
      ],
      "parameters": {
        "options": {
          "trim": true,
          "normalize": true,
          "mergeAttrs": true,
          "ignoreAttrs": true,
          "normalizeTags": true
        }
      },
      "typeVersion": 1
    },
    {
      "id": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
      "name": "Filter URLs",
      "type": "n8n-nodes-base.filter",
      "position": [
        440,
        -60
      ],
      "parameters": {
        "options": {},
        "conditions": {
          "options": {
            "version": 2,
            "leftValue": "",
            "caseSensitive": true,
            "typeValidation": "strict"
          },
          "combinator": "and",
          "conditions": [
            {
              "id": "0bf8e98c-b6c5-4129-852c-0d3e63f32f9f",
              "operator": {
                "type": "string",
                "operation": "endsWith"
              },
              "leftValue": "={{ $json.loc }}",
              "rightValue": ".pdf"
            }
          ]
        }
      },
      "typeVersion": 2.2
    },
    {
      "id": "1d3fed97-1e72-426c-a48d-1a9683f40c4c",
      "name": "Sticky Note1",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -300,
        -140
      ],
      "parameters": {
        "color": 6,
        "width": 150,
        "height": 240,
        "content": "**Set your sitemap.xml\nurl here.**"
      },
      "typeVersion": 1
    },
    {
      "id": "521ec74d-6707-47fd-992d-eecebed415ab",
      "name": "Sticky Note2",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        420,
        -140
      ],
      "parameters": {
        "color": 6,
        "width": 150,
        "height": 240,
        "content": "**Create your filter here.**"
      },
      "typeVersion": 1
    },
    {
      "id": "07e6c3de-cc72-490d-b614-67034ce04bfb",
      "name": "Sticky Note3",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -140,
        -180
      ],
      "parameters": {
        "color": 7,
        "width": 540,
        "height": 300,
        "content": "## Fetch and process the sitemap.xml file\nThis part fetches and process the sitemap.xml file from XML data to JSON that we can work with."
      },
      "typeVersion": 1
    },
    {
      "id": "abf5f02d-d2a0-43f1-9a1f-386cc4f9861b",
      "name": "Sticky Note",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        -780,
        -220
      ],
      "parameters": {
        "width": 280,
        "height": 420,
        "content": "## Sitemap.xml reader\nThis workflow reads an sitemap.xml and filters out the entries you want.\n\nBy default only PDF documents are returned at the end of the workflow.\n\n**SETUP**\n- Edit the **Set sitemap URL** block and add the url to the sitemap you want to read.\n\n- Edit the **Filter URLs** to your needs."
      },
      "typeVersion": 1
    }
  ],
  "active": false,
  "pinData": {},
  "settings": {
    "executionOrder": "v1"
  },
  "versionId": "74793599-4c7d-4532-bbd5-a2ce4761fbc8",
  "connections": {
    "Split Out": {
      "main": [
        [
          {
            "node": "Filter URLs",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Get Sitemap": {
      "main": [
        [
          {
            "node": "Convert Sitemap to JSON",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Set sitemap URL": {
      "main": [
        [
          {
            "node": "Get Sitemap",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "Convert Sitemap to JSON": {
      "main": [
        [
          {
            "node": "Split Out",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "‘Test workflow’ trigger": {
      "main": [
        [
          {
            "node": "Set sitemap URL",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}

Workflow n8n sitemap, data management : pour qui est ce workflow ?

Ce workflow s'adresse aux équipes marketing, aux développeurs et aux agences de communication qui cherchent à automatiser la gestion des données extraites des sitemaps. Il est adapté aux entreprises de toutes tailles, avec un niveau technique intermédiaire requis pour sa mise en œuvre.

Workflow n8n sitemap, data management : problème résolu

Ce workflow résout le problème de la gestion manuelle des URLs extraites des sitemaps, un processus souvent long et sujet à des erreurs. En automatisant cette tâche, les utilisateurs gagnent un temps précieux et réduisent les risques d'erreurs humaines, ce qui se traduit par une efficacité accrue dans la gestion de leurs ressources numériques. Après la mise en place de ce workflow, les utilisateurs peuvent s'attendre à une extraction rapide et fiable des données, leur permettant de se concentrer sur des analyses et des stratégies plus approfondies.

Workflow n8n sitemap, data management : étapes du workflow

Étape 1 : Le processus commence par un déclencheur manuel qui permet à l'utilisateur de lancer le workflow.

  • Étape 1 : L'utilisateur définit l'URL du sitemap à l'aide d'un nœud de configuration.
  • Étape 2 : Les données sont ensuite séparées grâce au nœud 'Split Out'.
  • Étape 3 : Le nœud 'Get Sitemap' effectue une requête HTTP pour récupérer le contenu du sitemap.
  • Étape 4 : Les données XML récupérées sont converties en JSON via le nœud 'Convert Sitemap to JSON'.
  • Étape 5 : Le nœud 'Filter URLs' applique des conditions pour ne garder que les URLs pertinentes. Enfin, plusieurs notes autocollantes sont ajoutées pour documenter les étapes du processus.

Workflow n8n sitemap, data management : guide de personnalisation

Pour personnaliser ce workflow, commencez par modifier l'URL du sitemap dans le nœud 'Set sitemap URL'. Vous pouvez également ajuster les conditions dans le nœud 'Filter URLs' pour cibler des URLs spécifiques selon vos besoins. Si vous souhaitez intégrer d'autres outils, envisagez d'ajouter des nœuds supplémentaires pour envoyer les données filtrées vers une base de données ou un outil de reporting. Assurez-vous de tester le workflow après chaque modification pour garantir son bon fonctionnement. Enfin, pour sécuriser le flux, pensez à mettre en place des mécanismes de monitoring pour suivre les performances et détecter d'éventuelles erreurs.