Batch-PDF-zu-Markdown-Konvertierung (Google Drive und LLM-Parsing)

Fortgeschritten

Dies ist ein Content Creation, Multimodal AI-Bereich Automatisierungsworkflow mit 8 Nodes. Hauptsächlich werden If, Set, Code, Slack, GoogleDrive und andere Nodes verwendet. Batch-Konvertierung von PDF zu Markdown mit Google Drive und LLM-gesteuerter Analyse

Voraussetzungen
  • Slack Bot Token oder Webhook URL
  • Google Drive API-Anmeldedaten
Workflow-Vorschau
Visualisierung der Node-Verbindungen, mit Zoom und Pan
Workflow exportieren
Kopieren Sie die folgende JSON-Konfiguration und importieren Sie sie in n8n
{
  "meta": {
    "instanceId": "placeholder"
  },
  "nodes": [
    {
      "id": "info-note",
      "name": "Workflow-Info",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        250,
        150
      ],
      "parameters": {
        "content": "## Batch PDF Converter\n\nThis workflow converts PDFs to Markdown in bulk.\n\nSupported sources:\n- Direct URLs\n- Google Drive\n- Dropbox\n- Local files"
      },
      "typeVersion": 1
    },
    {
      "id": "google-drive",
      "name": "Google Drive - PDFs auflisten",
      "type": "n8n-nodes-base.googleDrive",
      "notes": "List all PDFs from specified folder",
      "position": [
        450,
        300
      ],
      "parameters": {
        "fileId": "={{ $json.folderId }}",
        "operation": "list"
      },
      "typeVersion": 1
    },
    {
      "id": "filter-pdfs",
      "name": "Nur PDFs filtern",
      "type": "n8n-nodes-base.if",
      "position": [
        650,
        300
      ],
      "parameters": {
        "conditions": {
          "string": [
            {
              "value1": "={{ $json.mimeType }}",
              "value2": "application/pdf"
            }
          ]
        }
      },
      "typeVersion": 1
    },
    {
      "id": "pdfvector-convert",
      "name": "PDF Vector - In Markdown konvertieren",
      "type": "n8n-nodes-pdfvector.pdfVector",
      "notes": "Convert each PDF to Markdown",
      "position": [
        850,
        300
      ],
      "parameters": {
        "useLlm": "auto",
        "resource": "document",
        "operation": "parse",
        "documentUrl": "={{ $json.webViewLink }}"
      },
      "typeVersion": 1
    },
    {
      "id": "prepare-output",
      "name": "Ausgabe vorbereiten",
      "type": "n8n-nodes-base.code",
      "position": [
        1050,
        300
      ],
      "parameters": {
        "functionCode": "const fileName = $json.name.replace('.pdf', '.md');\nconst content = $json.content;\nconst metadata = {\n  originalFile: $json.name,\n  convertedAt: new Date().toISOString(),\n  pageCount: $json.pageCount || 'unknown',\n  credits: $json.creditsUsed || 0\n};\n\nreturn {\n  fileName,\n  content,\n  metadata\n};"
      },
      "typeVersion": 1
    },
    {
      "id": "save-markdown",
      "name": "Markdown-Dateien speichern",
      "type": "n8n-nodes-base.googleDrive",
      "position": [
        1250,
        300
      ],
      "parameters": {
        "name": "={{ $json.fileName }}",
        "content": "={{ $json.content }}",
        "parents": [
          "{{ $json.outputFolderId }}"
        ],
        "operation": "upload"
      },
      "typeVersion": 1
    },
    {
      "id": "summary-stats",
      "name": "Konvertierungszusammenfassung",
      "type": "n8n-nodes-base.set",
      "position": [
        1450,
        300
      ],
      "parameters": {
        "values": {
          "string": [
            {
              "name": "summary",
              "value": "=Converted {{ $items().length }} PDFs to Markdown\nTotal credits used: {{ $items().reduce((sum, item) => sum + (item.json.metadata.credits || 0), 0) }}"
            }
          ]
        }
      },
      "typeVersion": 1
    },
    {
      "id": "notify-complete",
      "name": "Benachrichtigung senden",
      "type": "n8n-nodes-base.slack",
      "position": [
        1650,
        300
      ],
      "parameters": {
        "message": "=Batch Conversion Complete!\n\n{{ $json.summary }}\n\nFiles saved to Google Drive.",
        "additionalFields": {}
      },
      "typeVersion": 1
    }
  ],
  "connections": {
    "prepare-output": {
      "main": [
        [
          {
            "node": "save-markdown",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "filter-pdfs": {
      "main": [
        [
          {
            "node": "pdfvector-convert",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "summary-stats": {
      "main": [
        [
          {
            "node": "notify-complete",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "save-markdown": {
      "main": [
        [
          {
            "node": "summary-stats",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "google-drive": {
      "main": [
        [
          {
            "node": "filter-pdfs",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "pdfvector-convert": {
      "main": [
        [
          {
            "node": "prepare-output",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}
Häufig gestellte Fragen

Wie verwende ich diesen Workflow?

Kopieren Sie den obigen JSON-Code, erstellen Sie einen neuen Workflow in Ihrer n8n-Instanz und wählen Sie "Aus JSON importieren". Fügen Sie die Konfiguration ein und passen Sie die Anmeldedaten nach Bedarf an.

Für welche Szenarien ist dieser Workflow geeignet?

Fortgeschritten - Content-Erstellung, Multimodales KI

Ist es kostenpflichtig?

Dieser Workflow ist völlig kostenlos. Beachten Sie jedoch, dass Drittanbieterdienste (wie OpenAI API), die im Workflow verwendet werden, möglicherweise kostenpflichtig sind.

Workflow-Informationen
Schwierigkeitsgrad
Fortgeschritten
Anzahl der Nodes8
Kategorie2
Node-Typen7
Schwierigkeitsbeschreibung

Für erfahrene Benutzer, mittelkomplexe Workflows mit 6-15 Nodes

Autor
PDF Vector

PDF Vector

@pdfvector

A fully featured PDF APIs for developers - Parse any PDF or Word document, extract structured data, and access millions of academic papers - all through simple APIs.

Externe Links
Auf n8n.io ansehen

Diesen Workflow teilen

Kategorien

Kategorien: 34