REST API · Sortie JSON · 100 pages gratuites/mois

API d’extraction de données

Extrayez des données structurées de PDFs, factures, reçus et formulaires avec un seul appel API. Envoyez n’importe quel document et recevez un JSON propre. Aucun modèle, aucune donnée d’entraînement, aucun fichier de configuration.

Extraire gratuitement Lire la documentation

Un seul appel API pour extraire les données de n’importe quel document

Envoyez un document au endpoint d’extraction et recevez un JSON structuré. Définissez un schéma pour contrôler précisément les champs dont vous avez besoin, ou laissez l’API détecter automatiquement la structure du document.

request.sh

curl -X POST \
  https://api-parse.conversiontools.io/v1/extract \
  -H "Authorization: Bearer YOUR_API_KEY" \
  -F "file=@invoice.pdf" \
  -F 'schema={
    "vendor": "string",
    "date": "string",
    "total": "number",
    "line_items": [{
      "description": "string",
      "amount": "number"
    }]
  }'

response.json

{
  "status": "completed",
  "data": {
    "vendor": "Acme Corp",
    "date": "2026-03-01",
    "total": 1250.00,
    "line_items": [
      {
        "description": "Consulting services",
        "amount": 1000.00
      },
      {
        "description": "Expenses",
        "amount": 250.00
      }
    ]
  }
}

Comment fonctionne l’API d’extraction de données

Trois étapes pour passer d’un document brut à des données structurées. Aucun entraînement, aucun modèle - l’API comprend vos documents automatiquement.

Téléversez votre document

Envoyez n’importe quel PDF, image ou document scanné vers le endpoint de l’API. Prend en charge les factures, les reçus, les formulaires, les contrats et plus encore.

L’IA extrait les données

L’API lit le document, comprend sa structure et extrait les champs que vous avez demandés dans la définition de votre schéma.

Obtenez un JSON structuré

Recevez un JSON propre et typé qui correspond à votre schéma. Prêt à être stocké dans une base de données, intégré dans un pipeline ou affiché dans votre application.

Pourquoi les développeurs choisissent Parse pour l’extraction de données

Conçu pour les développeurs qui ont besoin d’une extraction de données fiable et précise, sans la complexité des chaînes OCR classiques.

Extraction basée sur l’IA

Utilise de grands modèles de langage pour comprendre le contexte et la mise en page d’un document. Gère des formats variés sans règles personnalisées ni configuration de modèle.

API REST simple

Un endpoint, un appel API. Envoyez un fichier, recevez du JSON. Aucun SDK requis - fonctionne avec curl, Python, Node.js ou n’importe quel client HTTP.

Schémas personnalisés

Définissez précisément les champs à extraire avec des schémas JSON. Prise en charge des chaînes, nombres, dates, tableaux et objets imbriqués. Réutilisez les schémas d’un document à l’autre.

Plusieurs formats de document

Traitez des PDFs, des images scannées, des JPEGs, des PNGs, des fichiers GIF, WebP, TIFF, BMP, HEIC et AVIF. Fonctionne avec les documents numériques et scannés dans toutes les langues.

Confidentialité et sécurité

Les fichiers sont traités et supprimés automatiquement. Aucune donnée de document n’est conservée après l’extraction. Infrastructure hébergée dans l’UE avec des connexions chiffrées.

Temps de réponse rapides

La plupart des documents d’une seule page sont traités en quelques secondes. Modes synchrone et asynchrone disponibles selon votre cas d’usage et la taille du document.

Conçu pour des documents complexes du monde réel

La plupart des documents ne sont pas un texte propre sur une seule colonne. L’API lit aussi les plus difficiles - tableaux, scans et pages qui s’allongent.

Tableaux et listes

Reconnaît les données tabulaires, les listes à puces, les clauses numérotées et les structures imbriquées, et renvoie chaque ligne ou élément comme un objet typé dans un tableau JSON.

Texte manuscrit

Extrait le contenu imprimé, dactylographié et manuscrit des documents scannés, y compris les annotations et les champs de formulaire remplis.

Documents multi-pages

Traite un document entier en un seul appel et conserve le contexte entre les pages, de sorte que les valeurs qui s’étendent sur les en-têtes, les sections et les annexes reviennent ensemble.

Plus de cas d’usage d’extraction de documents

La même API pilotée par schéma fonctionne pour tout type de document. Définissez un schéma une fois et extrayez des données de milliers de fichiers.

API d’analyse de PDF

Analysez n’importe quel PDF en JSON structuré, scanné ou numérique.

Extraction de factures

Fournisseur, lignes de détail, totaux, taxes et dates des factures.

Analyse de reçus

Magasin, articles, totaux et mode de paiement des reçus.

Extraction de bons de commande

Numéro de commande, fournisseur, acheteur et lignes de détail au niveau SKU.

Relevé bancaire vers JSON

Transactions, soldes courants et dates pour le rapprochement.

Extraction de formulaires fiscaux

Données au niveau des cases des formulaires W-2, 1099 et autres formulaires fiscaux.

Extraction de données contractuelles

Parties, dates, droit applicable et clauses clés.

Extraction de connaissements

Transporteur, parties, ports, conteneurs y carga.

Questions fréquentes

Questions courantes sur l’API d’extraction de données.

Quels formats de fichier l’API d’extraction de données prend-elle en charge ?

Parse accepte les fichiers PDF, JPEG, PNG, GIF, WebP, TIFF, BMP, HEIC et AVIF. Vous pouvez extraire des données structurées de documents scannés, de PDFs numériques, de photos de reçus et de tout document basé sur une image.

Dois-je créer des modèles pour chaque type de document ?

Non. Parse utilise l’IA pour comprendre la structure du document automatiquement. Vous définissez un schéma JSON décrivant les champs souhaités, et l’API les extrait de n’importe quel document - aucun modèle, donnée d’entraînement ou fichier de configuration requis.

Quelle est la précision de l’extraction de données ?

Parse utilise de grands modèles de langage pour comprendre le contexte du document, pas seulement la correspondance de texte par OCR. Cela signifie qu’il gère des mises en page, des langues et des formats variés. La précision dépend de la qualité du document, mais la plupart des documents structurés comme les factures et les reçus atteignent des taux d’extraction élevés.

Existe-t-il une offre gratuite pour l’API d’extraction de données ?

Oui. L’offre gratuite inclut 100 pages par mois avec un accès complet à l’API, des schémas personnalisés et tous les formats de fichier pris en charge. Aucune carte bancaire requise pour démarrer.

Comment gérer de gros volumes de documents ?

Pour le traitement par lots, utilisez le endpoint d’extraction asynchrone. Soumettez des documents et interrogez les résultats par polling, ou utilisez des webhooks pour être averti lorsque l’extraction est terminée. L’offre Pro prend en charge 5 000 pages par mois avec un traitement prioritaire.

Commencez dès aujourd’hui à extraire vos données

Obtenez votre clé API et extrayez les données de votre premier document en quelques minutes. 100 pages par mois gratuites - aucune carte bancaire requise.

Démarrer gratuitement Référence de l’API