Lecture de sitemaps et filtrage d'URL
Intermédiaire
Ceci est unEngineering, Marketingworkflow d'automatisation du domainecontenant 10 nœuds.Utilise principalement des nœuds comme Set, Xml, Filter, SplitOut, HttpRequest. Extraire et traiter des liens spécifiques à partir de sitemap.xml
Prérequis
- •Peut nécessiter les informations d'identification d'authentification de l'API cible
Nœuds utilisés (10)
Catégorie
Aperçu du workflow
Visualisation des connexions entre les nœuds, avec support du zoom et du déplacement
Exporter le workflow
Copiez la configuration JSON suivante dans n8n pour importer et utiliser ce workflow
{
"id": "7fdJOvYNILCr24fH",
"meta": {
"instanceId": "568298fde06d3db80a2eea77fe5bf45f0c7bb898dea20b769944e9ac7c6c5a80"
},
"name": "Read sitemap and filter URLs",
"tags": [],
"nodes": [
{
"id": "38910330-5286-4f3f-b62e-9216acccd503",
"name": "Déclencheur 'Test workflow'",
"type": "n8n-nodes-base.manualTrigger",
"position": [
-460,
-60
],
"parameters": {},
"typeVersion": 1
},
{
"id": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
"name": "Définir l'URL du plan de site",
"type": "n8n-nodes-base.set",
"position": [
-280,
-60
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "d6c5ac86-6d67-42fb-96ec-9826caf452e2",
"name": "sitemapUrl",
"type": "string",
"value": "https://duckduckgo.com/sitemap.xml"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "0d957deb-5830-4077-97e4-437dc7c0e527",
"name": "Diviser",
"type": "n8n-nodes-base.splitOut",
"position": [
260,
-60
],
"parameters": {
"options": {},
"fieldToSplitOut": "urlset.url"
},
"typeVersion": 1
},
{
"id": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
"name": "Obtenir le plan de site",
"type": "n8n-nodes-base.httpRequest",
"position": [
-100,
-60
],
"parameters": {
"url": "={{ $json.sitemapUrl }}",
"options": {}
},
"typeVersion": 4.2
},
{
"id": "d3b86577-01fc-40f8-ab65-93ba420187b8",
"name": "Convertir le plan de site en JSON",
"type": "n8n-nodes-base.xml",
"position": [
80,
-60
],
"parameters": {
"options": {
"trim": true,
"normalize": true,
"mergeAttrs": true,
"ignoreAttrs": true,
"normalizeTags": true
}
},
"typeVersion": 1
},
{
"id": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
"name": "Filtrer les URL",
"type": "n8n-nodes-base.filter",
"position": [
440,
-60
],
"parameters": {
"options": {},
"conditions": {
"options": {
"version": 2,
"leftValue": "",
"caseSensitive": true,
"typeValidation": "strict"
},
"combinator": "and",
"conditions": [
{
"id": "0bf8e98c-b6c5-4129-852c-0d3e63f32f9f",
"operator": {
"type": "string",
"operation": "endsWith"
},
"leftValue": "={{ $json.loc }}",
"rightValue": ".pdf"
}
]
}
},
"typeVersion": 2.2
},
{
"id": "1d3fed97-1e72-426c-a48d-1a9683f40c4c",
"name": "Note adhésive 1",
"type": "n8n-nodes-base.stickyNote",
"position": [
-300,
-140
],
"parameters": {
"color": 6,
"width": 150,
"height": 240,
"content": "**Set your sitemap.xml\nurl here.**"
},
"typeVersion": 1
},
{
"id": "521ec74d-6707-47fd-992d-eecebed415ab",
"name": "Note adhésive 2",
"type": "n8n-nodes-base.stickyNote",
"position": [
420,
-140
],
"parameters": {
"color": 6,
"width": 150,
"height": 240,
"content": "**Create your filter here.**"
},
"typeVersion": 1
},
{
"id": "07e6c3de-cc72-490d-b614-67034ce04bfb",
"name": "Note adhésive 3",
"type": "n8n-nodes-base.stickyNote",
"position": [
-140,
-180
],
"parameters": {
"color": 7,
"width": 540,
"height": 300,
"content": "## Fetch and process the sitemap.xml file\nThis part fetches and process the sitemap.xml file from XML data to JSON that we can work with."
},
"typeVersion": 1
},
{
"id": "abf5f02d-d2a0-43f1-9a1f-386cc4f9861b",
"name": "Note adhésive",
"type": "n8n-nodes-base.stickyNote",
"position": [
-780,
-220
],
"parameters": {
"width": 280,
"height": 420,
"content": "## Sitemap.xml reader\nThis workflow reads an sitemap.xml and filters out the entries you want.\n\nBy default only PDF documents are returned at the end of the workflow.\n\n**SETUP**\n- Edit the **Set sitemap URL** block and add the url to the sitemap you want to read.\n\n- Edit the **Filter URLs** to your needs."
},
"typeVersion": 1
}
],
"active": false,
"pinData": {},
"settings": {
"executionOrder": "v1"
},
"versionId": "74793599-4c7d-4532-bbd5-a2ce4761fbc8",
"connections": {
"0d957deb-5830-4077-97e4-437dc7c0e527": {
"main": [
[
{
"node": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
"type": "main",
"index": 0
}
]
]
},
"7021088c-dfa1-4aae-b2e7-15b0ca10a750": {
"main": [
[
{
"node": "d3b86577-01fc-40f8-ab65-93ba420187b8",
"type": "main",
"index": 0
}
]
]
},
"d4e5991b-62d9-45ca-962f-c1077f3bce19": {
"main": [
[
{
"node": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
"type": "main",
"index": 0
}
]
]
},
"d3b86577-01fc-40f8-ab65-93ba420187b8": {
"main": [
[
{
"node": "0d957deb-5830-4077-97e4-437dc7c0e527",
"type": "main",
"index": 0
}
]
]
},
"38910330-5286-4f3f-b62e-9216acccd503": {
"main": [
[
{
"node": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
"type": "main",
"index": 0
}
]
]
}
}
}Foire aux questions
Comment utiliser ce workflow ?
Copiez le code de configuration JSON ci-dessus, créez un nouveau workflow dans votre instance n8n et sélectionnez "Importer depuis le JSON", collez la configuration et modifiez les paramètres d'authentification selon vos besoins.
Dans quelles scénarios ce workflow est-il adapté ?
Intermédiaire - Ingénierie, Marketing
Est-ce payant ?
Ce workflow est entièrement gratuit et peut être utilisé directement. Veuillez noter que les services tiers utilisés dans le workflow (comme l'API OpenAI) peuvent nécessiter un paiement de votre part.
Workflows recommandés
Extraction de liens internes dans les pages web
Extraire les liens internes à partir de pages web
If
Set
Html
+
If
Set
Html
13 NœudsAudun
Ingénierie
✍️🌟 Un agent IA basé sur l'IA visuelle pour les crawlers - Utilisation de Google Sheets, ScrapingBee et Gemini
✨ 基于视觉deAIagent爬虫 - utilisationGoogle Sheets、ScrapingBeeetGemini
Set
Markdown
Split Out
+
Set
Markdown
Split Out
29 NœudsDataki
Ventes
Extracteur d'architecture d'API
Extracteur d'architecture d'API
If
Set
Code
+
If
Set
Code
88 NœudsPolina Medvedieva
Ingénierie
Mon workflow 5
Génération automatisée de prospects LinkedIn avec personnalisation d'e-mails par IA (inachevé)
If
Set
Code
+
If
Set
Code
37 NœudsMatthieu
Ventes
Mon sous-flux de travail 3
utilisationDataForSEO进行automatisationSEO关键词与SERPanalyse,打造高转化contenu
Set
Filter
Split Out
+
Set
Filter
Split Out
55 NœudsSam Yassine
Marketing
Téléverseur CSV vers HubSpot (cartographie dynamique de champs et intégration Google Sheets)
Chargeur de fichiers CSV vers HubSpot avec mappage de champs dynamique et intégration Google Sheets
If
Set
Code
+
If
Set
Code
36 NœudsPollupAI
Intelligence Artificielle
Informations sur le workflow
Niveau de difficulté
Intermédiaire
Nombre de nœuds10
Catégorie2
Types de nœuds7
Description de la difficulté
Auteur
Liens externes
Voir sur n8n.io →
Partager ce workflow