Extrayez des données structurées de PDFs, factures, reçus et formulaires avec un seul appel API. Envoyez n’importe quel document et recevez un JSON propre. Aucun modèle, aucune donnée d’entraînement, aucun fichier de configuration.
Envoyez un document au endpoint d’extraction et recevez un JSON structuré. Définissez un schéma pour contrôler précisément les champs dont vous avez besoin, ou laissez l’API détecter automatiquement la structure du document.
curl -X POST \
https://api-parse.conversiontools.io/v1/extract \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@invoice.pdf" \
-F 'schema={
"vendor": "string",
"date": "string",
"total": "number",
"line_items": [{
"description": "string",
"amount": "number"
}]
}'{
"status": "completed",
"data": {
"vendor": "Acme Corp",
"date": "2026-03-01",
"total": 1250.00,
"line_items": [
{
"description": "Consulting services",
"amount": 1000.00
},
{
"description": "Expenses",
"amount": 250.00
}
]
}
}Trois étapes pour passer d’un document brut à des données structurées. Aucun entraînement, aucun modèle - l’API comprend vos documents automatiquement.
Envoyez n’importe quel PDF, image ou document scanné vers le endpoint de l’API. Prend en charge les factures, les reçus, les formulaires, les contrats et plus encore.
L’API lit le document, comprend sa structure et extrait les champs que vous avez demandés dans la définition de votre schéma.
Recevez un JSON propre et typé qui correspond à votre schéma. Prêt à être stocké dans une base de données, intégré dans un pipeline ou affiché dans votre application.
Conçu pour les développeurs qui ont besoin d’une extraction de données fiable et précise, sans la complexité des chaînes OCR classiques.
Utilise de grands modèles de langage pour comprendre le contexte et la mise en page d’un document. Gère des formats variés sans règles personnalisées ni configuration de modèle.
Un endpoint, un appel API. Envoyez un fichier, recevez du JSON. Aucun SDK requis - fonctionne avec curl, Python, Node.js ou n’importe quel client HTTP.
Définissez précisément les champs à extraire avec des schémas JSON. Prise en charge des chaînes, nombres, dates, tableaux et objets imbriqués. Réutilisez les schémas d’un document à l’autre.
Traitez des PDFs, des images scannées, des JPEGs, des PNGs, des fichiers GIF, WebP, TIFF, BMP, HEIC et AVIF. Fonctionne avec les documents numériques et scannés dans toutes les langues.
Les fichiers sont traités et supprimés automatiquement. Aucune donnée de document n’est conservée après l’extraction. Infrastructure hébergée dans l’UE avec des connexions chiffrées.
La plupart des documents d’une seule page sont traités en quelques secondes. Modes synchrone et asynchrone disponibles selon votre cas d’usage et la taille du document.
La plupart des documents ne sont pas un texte propre sur une seule colonne. L’API lit aussi les plus difficiles - tableaux, scans et pages qui s’allongent.
Reconnaît les données tabulaires, les listes à puces, les clauses numérotées et les structures imbriquées, et renvoie chaque ligne ou élément comme un objet typé dans un tableau JSON.
Extrait le contenu imprimé, dactylographié et manuscrit des documents scannés, y compris les annotations et les champs de formulaire remplis.
Traite un document entier en un seul appel et conserve le contexte entre les pages, de sorte que les valeurs qui s’étendent sur les en-têtes, les sections et les annexes reviennent ensemble.
La même API pilotée par schéma fonctionne pour tout type de document. Définissez un schéma une fois et extrayez des données de milliers de fichiers.
Analysez n’importe quel PDF en JSON structuré, scanné ou numérique.
Fournisseur, lignes de détail, totaux, taxes et dates des factures.
Magasin, articles, totaux et mode de paiement des reçus.
Numéro de commande, fournisseur, acheteur et lignes de détail au niveau SKU.
Transactions, soldes courants et dates pour le rapprochement.
Données au niveau des cases des formulaires W-2, 1099 et autres formulaires fiscaux.
Parties, dates, droit applicable et clauses clés.
Transporteur, parties, ports, conteneurs y carga.
Questions courantes sur l’API d’extraction de données.
Parse accepte les fichiers PDF, JPEG, PNG, GIF, WebP, TIFF, BMP, HEIC et AVIF. Vous pouvez extraire des données structurées de documents scannés, de PDFs numériques, de photos de reçus et de tout document basé sur une image.
Non. Parse utilise l’IA pour comprendre la structure du document automatiquement. Vous définissez un schéma JSON décrivant les champs souhaités, et l’API les extrait de n’importe quel document - aucun modèle, donnée d’entraînement ou fichier de configuration requis.
Parse utilise de grands modèles de langage pour comprendre le contexte du document, pas seulement la correspondance de texte par OCR. Cela signifie qu’il gère des mises en page, des langues et des formats variés. La précision dépend de la qualité du document, mais la plupart des documents structurés comme les factures et les reçus atteignent des taux d’extraction élevés.
Oui. L’offre gratuite inclut 100 pages par mois avec un accès complet à l’API, des schémas personnalisés et tous les formats de fichier pris en charge. Aucune carte bancaire requise pour démarrer.
Pour le traitement par lots, utilisez le endpoint d’extraction asynchrone. Soumettez des documents et interrogez les résultats par polling, ou utilisez des webhooks pour être averti lorsque l’extraction est terminée. L’offre Pro prend en charge 5 000 pages par mois avec un traitement prioritaire.
Obtenez votre clé API et extrayez les données de votre premier document en quelques minutes. 100 pages par mois gratuites - aucune carte bancaire requise.