Conversion de masse de PDF en Markdown (Google Drive et analyse par LLM)

Intermédiaire

Ceci est unContent Creation, Multimodal AIworkflow d'automatisation du domainecontenant 8 nœuds.Utilise principalement des nœuds comme If, Set, Code, Slack, GoogleDrive. Conversion de masse de PDF en Markdown avec Google Drive et une analyse pilotée par LLM

Prérequis
  • Token Bot Slack ou URL Webhook
  • Informations d'identification Google Drive API
Aperçu du workflow
Visualisation des connexions entre les nœuds, avec support du zoom et du déplacement
Exporter le workflow
Copiez la configuration JSON suivante dans n8n pour importer et utiliser ce workflow
{
  "meta": {
    "instanceId": "placeholder"
  },
  "nodes": [
    {
      "id": "info-note",
      "name": "Informations du workflow",
      "type": "n8n-nodes-base.stickyNote",
      "position": [
        250,
        150
      ],
      "parameters": {
        "content": "## Batch PDF Converter\n\nThis workflow converts PDFs to Markdown in bulk.\n\nSupported sources:\n- Direct URLs\n- Google Drive\n- Dropbox\n- Local files"
      },
      "typeVersion": 1
    },
    {
      "id": "google-drive",
      "name": "Google Drive - Lister les PDF",
      "type": "n8n-nodes-base.googleDrive",
      "notes": "List all PDFs from specified folder",
      "position": [
        450,
        300
      ],
      "parameters": {
        "fileId": "={{ $json.folderId }}",
        "operation": "list"
      },
      "typeVersion": 1
    },
    {
      "id": "filter-pdfs",
      "name": "Filtrer les PDF uniquement",
      "type": "n8n-nodes-base.if",
      "position": [
        650,
        300
      ],
      "parameters": {
        "conditions": {
          "string": [
            {
              "value1": "={{ $json.mimeType }}",
              "value2": "application/pdf"
            }
          ]
        }
      },
      "typeVersion": 1
    },
    {
      "id": "pdfvector-convert",
      "name": "PDF Vector - Convertir en Markdown",
      "type": "n8n-nodes-pdfvector.pdfVector",
      "notes": "Convert each PDF to Markdown",
      "position": [
        850,
        300
      ],
      "parameters": {
        "useLlm": "auto",
        "resource": "document",
        "operation": "parse",
        "documentUrl": "={{ $json.webViewLink }}"
      },
      "typeVersion": 1
    },
    {
      "id": "prepare-output",
      "name": "Préparer la sortie",
      "type": "n8n-nodes-base.code",
      "position": [
        1050,
        300
      ],
      "parameters": {
        "functionCode": "const fileName = $json.name.replace('.pdf', '.md');\nconst content = $json.content;\nconst metadata = {\n  originalFile: $json.name,\n  convertedAt: new Date().toISOString(),\n  pageCount: $json.pageCount || 'unknown',\n  credits: $json.creditsUsed || 0\n};\n\nreturn {\n  fileName,\n  content,\n  metadata\n};"
      },
      "typeVersion": 1
    },
    {
      "id": "save-markdown",
      "name": "Enregistrer les fichiers Markdown",
      "type": "n8n-nodes-base.googleDrive",
      "position": [
        1250,
        300
      ],
      "parameters": {
        "name": "={{ $json.fileName }}",
        "content": "={{ $json.content }}",
        "parents": [
          "{{ $json.outputFolderId }}"
        ],
        "operation": "upload"
      },
      "typeVersion": 1
    },
    {
      "id": "summary-stats",
      "name": "Résumé de la conversion",
      "type": "n8n-nodes-base.set",
      "position": [
        1450,
        300
      ],
      "parameters": {
        "values": {
          "string": [
            {
              "name": "summary",
              "value": "=Converted {{ $items().length }} PDFs to Markdown\nTotal credits used: {{ $items().reduce((sum, item) => sum + (item.json.metadata.credits || 0), 0) }}"
            }
          ]
        }
      },
      "typeVersion": 1
    },
    {
      "id": "notify-complete",
      "name": "Envoyer une notification",
      "type": "n8n-nodes-base.slack",
      "position": [
        1650,
        300
      ],
      "parameters": {
        "message": "=Batch Conversion Complete!\n\n{{ $json.summary }}\n\nFiles saved to Google Drive.",
        "additionalFields": {}
      },
      "typeVersion": 1
    }
  ],
  "connections": {
    "prepare-output": {
      "main": [
        [
          {
            "node": "save-markdown",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "filter-pdfs": {
      "main": [
        [
          {
            "node": "pdfvector-convert",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "summary-stats": {
      "main": [
        [
          {
            "node": "notify-complete",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "save-markdown": {
      "main": [
        [
          {
            "node": "summary-stats",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "google-drive": {
      "main": [
        [
          {
            "node": "filter-pdfs",
            "type": "main",
            "index": 0
          }
        ]
      ]
    },
    "pdfvector-convert": {
      "main": [
        [
          {
            "node": "prepare-output",
            "type": "main",
            "index": 0
          }
        ]
      ]
    }
  }
}
Foire aux questions

Comment utiliser ce workflow ?

Copiez le code de configuration JSON ci-dessus, créez un nouveau workflow dans votre instance n8n et sélectionnez "Importer depuis le JSON", collez la configuration et modifiez les paramètres d'authentification selon vos besoins.

Dans quelles scénarios ce workflow est-il adapté ?

Intermédiaire - Création de contenu, IA Multimodale

Est-ce payant ?

Ce workflow est entièrement gratuit et peut être utilisé directement. Veuillez noter que les services tiers utilisés dans le workflow (comme l'API OpenAI) peuvent nécessiter un paiement de votre part.

Workflows recommandés

Extraction et stockage de données de factures via PDF Vector, Google Drive et une base de données
Extraire et stocker les données des factures avec PDF Vector, Google Drive et une base de données
If
Code
Slack
+
If
Code
Slack
26 NœudsPDF Vector
Traitement des factures
会议纪要et行动项跟踪器
基于AIde会议纪要:utilisationGPT-4、任务分配et多渠道分发
If
Set
Code
+
If
Set
Code
38 NœudsJitesh Dugar
Création de contenu
Revue automatique de littérature académique avec GPT-4 et recherche multi-base de données
Utiliser GPT-4 et la recherche multi-base de données pour automatiser la synthèse de la littérature académique
If
Set
Code
+
If
Set
Code
13 NœudsPDF Vector
Extraction de documents
Automatisation de la publication RSS vers Medium avec Groq, Gemini et un système d'approbation Slack
Automatisation du flux de publication de RSS vers Medium avec Groq, Gemini et le système d'approbation Slack
If
Set
Code
+
If
Set
Code
41 NœudsObisDev
Création de contenu
Surveillance automatisée des publications académiques, avec des vecteurs PDF, GPT-3.5 et des alertes Slack
Automatisation de la surveillance d'articles académiques, avec des vecteurs PDF, GPT-3.5 et des notifications Slack
Set
Code
Slack
+
Set
Code
Slack
10 NœudsPDF Vector
Productivité personnelle
Extraction de données cliniques à partir de documents médicaux via PDF Vector et conformité HIPAA
Extraire des données cliniques de documents médicaux avec PDF Vector et conformité HIPAA
If
Code
Postgres
+
If
Code
Postgres
9 NœudsPDF Vector
Extraction de documents
Informations sur le workflow
Niveau de difficulté
Intermédiaire
Nombre de nœuds8
Catégorie2
Types de nœuds7
Description de la difficulté

Adapté aux utilisateurs expérimentés, avec des workflows de complexité moyenne contenant 6-15 nœuds

Auteur
PDF Vector

PDF Vector

@pdfvector

A fully featured PDF APIs for developers - Parse any PDF or Word document, extract structured data, and access millions of academic papers - all through simple APIs.

Liens externes
Voir sur n8n.io

Partager ce workflow

Catégories

Catégories: 34