Sitemaps lesen und URLs filtern
Fortgeschritten
Dies ist ein Engineering, Marketing-Bereich Automatisierungsworkflow mit 10 Nodes. Hauptsächlich werden Set, Xml, Filter, SplitOut, HttpRequest und andere Nodes verwendet. Extrahieren und Verarbeiten spezifischer Links aus sitemap.xml
Voraussetzungen
- •Möglicherweise sind Ziel-API-Anmeldedaten erforderlich
Verwendete Nodes (10)
Kategorie
Workflow-Vorschau
Visualisierung der Node-Verbindungen, mit Zoom und Pan
Workflow exportieren
Kopieren Sie die folgende JSON-Konfiguration und importieren Sie sie in n8n
{
"id": "7fdJOvYNILCr24fH",
"meta": {
"instanceId": "568298fde06d3db80a2eea77fe5bf45f0c7bb898dea20b769944e9ac7c6c5a80"
},
"name": "Read sitemap and filter URLs",
"tags": [],
"nodes": [
{
"id": "38910330-5286-4f3f-b62e-9216acccd503",
"name": "'Test-Workflow'-Trigger",
"type": "n8n-nodes-base.manualTrigger",
"position": [
-460,
-60
],
"parameters": {},
"typeVersion": 1
},
{
"id": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
"name": "Sitemap-URL setzen",
"type": "n8n-nodes-base.set",
"position": [
-280,
-60
],
"parameters": {
"options": {},
"assignments": {
"assignments": [
{
"id": "d6c5ac86-6d67-42fb-96ec-9826caf452e2",
"name": "sitemapUrl",
"type": "string",
"value": "https://duckduckgo.com/sitemap.xml"
}
]
}
},
"typeVersion": 3.4
},
{
"id": "0d957deb-5830-4077-97e4-437dc7c0e527",
"name": "Aufteilen",
"type": "n8n-nodes-base.splitOut",
"position": [
260,
-60
],
"parameters": {
"options": {},
"fieldToSplitOut": "urlset.url"
},
"typeVersion": 1
},
{
"id": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
"name": "Sitemap abrufen",
"type": "n8n-nodes-base.httpRequest",
"position": [
-100,
-60
],
"parameters": {
"url": "={{ $json.sitemapUrl }}",
"options": {}
},
"typeVersion": 4.2
},
{
"id": "d3b86577-01fc-40f8-ab65-93ba420187b8",
"name": "Sitemap in JSON konvertieren",
"type": "n8n-nodes-base.xml",
"position": [
80,
-60
],
"parameters": {
"options": {
"trim": true,
"normalize": true,
"mergeAttrs": true,
"ignoreAttrs": true,
"normalizeTags": true
}
},
"typeVersion": 1
},
{
"id": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
"name": "URLs filtern",
"type": "n8n-nodes-base.filter",
"position": [
440,
-60
],
"parameters": {
"options": {},
"conditions": {
"options": {
"version": 2,
"leftValue": "",
"caseSensitive": true,
"typeValidation": "strict"
},
"combinator": "and",
"conditions": [
{
"id": "0bf8e98c-b6c5-4129-852c-0d3e63f32f9f",
"operator": {
"type": "string",
"operation": "endsWith"
},
"leftValue": "={{ $json.loc }}",
"rightValue": ".pdf"
}
]
}
},
"typeVersion": 2.2
},
{
"id": "1d3fed97-1e72-426c-a48d-1a9683f40c4c",
"name": "Haftnotiz1",
"type": "n8n-nodes-base.stickyNote",
"position": [
-300,
-140
],
"parameters": {
"color": 6,
"width": 150,
"height": 240,
"content": "**Set your sitemap.xml\nurl here.**"
},
"typeVersion": 1
},
{
"id": "521ec74d-6707-47fd-992d-eecebed415ab",
"name": "Haftnotiz2",
"type": "n8n-nodes-base.stickyNote",
"position": [
420,
-140
],
"parameters": {
"color": 6,
"width": 150,
"height": 240,
"content": "**Create your filter here.**"
},
"typeVersion": 1
},
{
"id": "07e6c3de-cc72-490d-b614-67034ce04bfb",
"name": "Haftnotiz3",
"type": "n8n-nodes-base.stickyNote",
"position": [
-140,
-180
],
"parameters": {
"color": 7,
"width": 540,
"height": 300,
"content": "## Fetch and process the sitemap.xml file\nThis part fetches and process the sitemap.xml file from XML data to JSON that we can work with."
},
"typeVersion": 1
},
{
"id": "abf5f02d-d2a0-43f1-9a1f-386cc4f9861b",
"name": "Haftnotiz",
"type": "n8n-nodes-base.stickyNote",
"position": [
-780,
-220
],
"parameters": {
"width": 280,
"height": 420,
"content": "## Sitemap.xml reader\nThis workflow reads an sitemap.xml and filters out the entries you want.\n\nBy default only PDF documents are returned at the end of the workflow.\n\n**SETUP**\n- Edit the **Set sitemap URL** block and add the url to the sitemap you want to read.\n\n- Edit the **Filter URLs** to your needs."
},
"typeVersion": 1
}
],
"active": false,
"pinData": {},
"settings": {
"executionOrder": "v1"
},
"versionId": "74793599-4c7d-4532-bbd5-a2ce4761fbc8",
"connections": {
"0d957deb-5830-4077-97e4-437dc7c0e527": {
"main": [
[
{
"node": "bc0758ae-06eb-4a29-a91e-414407ec8ade",
"type": "main",
"index": 0
}
]
]
},
"7021088c-dfa1-4aae-b2e7-15b0ca10a750": {
"main": [
[
{
"node": "d3b86577-01fc-40f8-ab65-93ba420187b8",
"type": "main",
"index": 0
}
]
]
},
"d4e5991b-62d9-45ca-962f-c1077f3bce19": {
"main": [
[
{
"node": "7021088c-dfa1-4aae-b2e7-15b0ca10a750",
"type": "main",
"index": 0
}
]
]
},
"d3b86577-01fc-40f8-ab65-93ba420187b8": {
"main": [
[
{
"node": "0d957deb-5830-4077-97e4-437dc7c0e527",
"type": "main",
"index": 0
}
]
]
},
"38910330-5286-4f3f-b62e-9216acccd503": {
"main": [
[
{
"node": "d4e5991b-62d9-45ca-962f-c1077f3bce19",
"type": "main",
"index": 0
}
]
]
}
}
}Häufig gestellte Fragen
Wie verwende ich diesen Workflow?
Kopieren Sie den obigen JSON-Code, erstellen Sie einen neuen Workflow in Ihrer n8n-Instanz und wählen Sie "Aus JSON importieren". Fügen Sie die Konfiguration ein und passen Sie die Anmeldedaten nach Bedarf an.
Für welche Szenarien ist dieser Workflow geeignet?
Fortgeschritten - Engineering, Marketing
Ist es kostenpflichtig?
Dieser Workflow ist völlig kostenlos. Beachten Sie jedoch, dass Drittanbieterdienste (wie OpenAI API), die im Workflow verwendet werden, möglicherweise kostenpflichtig sind.
Verwandte Workflows
Webseiten-Interne-Link-Extraktion
Interne Links von Webseiten extrahieren
If
Set
Html
+
If
Set
Html
13 NodesAudun
Engineering
Visuell basierter KI-Agent-Crawler - mit Google Sheets, ScrapingBee und Gemini
✨ Visueller KI-Agenten-Crawler - Verwendung von Google Tabellen, ScrapingBee und Gemini
Set
Markdown
Split Out
+
Set
Markdown
Split Out
29 NodesDataki
Vertrieb
API-Architektur-Explorer
API-Architektur-Extraktor
If
Set
Code
+
If
Set
Code
88 NodesPolina Medvedieva
Engineering
Mein Workflow 5
Automatisierte LinkedIn-Lead-Generierung mit personalisierter E-Mail-KI (unvollendet)
If
Set
Code
+
If
Set
Code
37 NodesMatthieu
Vertrieb
Mein Sub-Workflow 3
Verwenden Sie DataForSEO, um automatisierte SEO-Keyword- und SERP-Analysen durchzuführen und hochkonvertierende Inhalte zu erstellen
Set
Filter
Split Out
+
Set
Filter
Split Out
55 NodesSam Yassine
Marketing
CSV-zu-HubSpot-Uploader (dynamische Feldzuordnung und Google-Sheets-Integration)
CSV-zu-HubSpot-Uploader mit dynamischen Feldzuordnungen und Google Sheets-Integration
If
Set
Code
+
If
Set
Code
36 NodesPollupAI
Künstliche Intelligenz
Workflow-Informationen
Schwierigkeitsgrad
Fortgeschritten
Anzahl der Nodes10
Kategorie2
Node-Typen7
Autor
Externe Links
Auf n8n.io ansehen →
Diesen Workflow teilen