Extrahieren Sie strukturierte Daten aus PDFs, Rechnungen, Belegen und Formularen mit einem einzigen API-Aufruf. Senden Sie ein beliebiges Dokument und erhalten Sie sauberes JSON zurück. Keine Vorlagen, keine Trainingsdaten, keine Konfigurationsdateien.
Senden Sie ein Dokument an den Extraktions-Endpunkt und erhalten Sie strukturiertes JSON. Definieren Sie ein Schema, um genau die benötigten Felder festzulegen, oder lassen Sie die API die Dokumentstruktur automatisch erkennen.
curl -X POST \
https://api-parse.conversiontools.io/v1/extract \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@invoice.pdf" \
-F 'schema={
"vendor": "string",
"date": "string",
"total": "number",
"line_items": [{
"description": "string",
"amount": "number"
}]
}'{
"status": "completed",
"data": {
"vendor": "Acme Corp",
"date": "2026-03-01",
"total": 1250.00,
"line_items": [
{
"description": "Consulting services",
"amount": 1000.00
},
{
"description": "Expenses",
"amount": 250.00
}
]
}
}In drei Schritten vom Rohdokument zu strukturierten Daten. Kein Training, keine Vorlagen - die API versteht Ihre Dokumente automatisch.
Senden Sie ein beliebiges PDF, Bild oder gescanntes Dokument an den API-Endpunkt. Unterstützt Rechnungen, Belege, Formulare, Verträge und mehr.
Die API liest das Dokument, versteht seine Struktur und extrahiert die Felder, die Sie in Ihrer Schemadefinition angefordert haben.
Erhalten Sie sauberes, typisiertes JSON, das Ihrem Schema entspricht. Bereit zum Speichern in einer Datenbank, zur Einspeisung in eine Pipeline oder zur Anzeige in Ihrer Anwendung.
Entwickelt für Entwickler, die zuverlässige, präzise Datenextraktion brauchen, ohne die Komplexität klassischer OCR-Pipelines.
Nutzt große Sprachmodelle, um den Kontext und das Layout eines Dokuments zu verstehen. Verarbeitet unterschiedliche Formate ohne benutzerdefinierte Regeln oder Vorlagenkonfiguration.
Ein Endpunkt, ein API-Aufruf. Datei senden, JSON erhalten. Keine SDKs erforderlich - funktioniert mit curl, Python, Node.js oder jedem HTTP-Client.
Legen Sie mit JSON-Schemata genau fest, welche Felder extrahiert werden sollen. Unterstützung für Strings, Zahlen, Daten, Arrays und verschachtelte Objekte. Schemata über Dokumente hinweg wiederverwenden.
Verarbeiten Sie PDFs, gescannte Bilder, JPEGs, PNGs, GIF-, WebP-, TIFF-, BMP-, HEIC- und AVIF-Dateien. Funktioniert mit digitalen und gescannten Dokumenten in allen Sprachen.
Dateien werden automatisch verarbeitet und gelöscht. Nach der Extraktion werden keine Dokumentdaten gespeichert. In der EU gehostete Infrastruktur mit verschlüsselten Verbindungen.
Die meisten einseitigen Dokumente werden in Sekunden verarbeitet. Synchroner und asynchroner Modus stehen je nach Anwendungsfall und Dokumentgröße zur Verfügung.
Die meisten Dokumente sind kein sauberer, einspaltiger Text. Die API liest auch die unordentlichen - Tabellen, Scans und Seiten, die lang werden.
Erkennt Tabellendaten, Aufzählungslisten, nummerierte Klauseln und verschachtelte Strukturen und liefert jede Zeile oder jedes Element als typisiertes Objekt in einem JSON-Array zurück.
Extrahiert gedruckte, getippte und handschriftliche Inhalte aus gescannten Dokumenten, einschließlich Anmerkungen und ausgefüllter Formularfelder.
Verarbeitet ein ganzes Dokument in einem Aufruf und behält den Kontext über mehrere Seiten hinweg, sodass Werte, die sich über Kopfzeilen, Abschnitte und Anhänge erstrecken, gemeinsam zurückkommen.
Dieselbe schemagesteuerte API funktioniert für jeden Dokumenttyp. Definieren Sie ein Schema einmal und extrahieren Sie aus Tausenden von Dateien.
Jedes PDF in strukturiertes JSON umwandeln, gescannt oder digital.
Lieferant, Positionen, Summen, Steuern und Daten aus Rechnungen.
Geschäft, Artikel, Summen und Zahlungsmethode aus Belegen.
Bestellnummer, Lieferant, Käufer und Positionen auf SKU-Ebene.
Transaktionen, laufende Salden und Daten für den Abgleich.
Daten auf Feldebene aus W-2, 1099 und anderen Steuerformularen.
Parteien, Daten, geltendes Recht und wichtige Klauseln.
Spediteur, Parteien, Häfen, Container und Fracht.
Häufige Fragen zur API für Datenextraktion.
Parse akzeptiert PDF-, JPEG-, PNG-, GIF-, WebP-, TIFF-, BMP-, HEIC- und AVIF-Dateien. Sie können strukturierte Daten aus gescannten Dokumenten, digitalen PDFs, Fotos von Belegen und jedem bildbasierten Dokument extrahieren.
Nein. Parse nutzt KI, um die Dokumentstruktur automatisch zu verstehen. Sie definieren ein JSON-Schema, das die gewünschten Felder beschreibt, und die API extrahiert sie aus jedem Dokument - keine Vorlagen, Trainingsdaten oder Konfigurationsdateien erforderlich.
Parse nutzt große Sprachmodelle, um den Kontext eines Dokuments zu verstehen, nicht nur den Textabgleich per OCR. Das bedeutet, dass unterschiedliche Layouts, Sprachen und Formatierungen verarbeitet werden. Die Genauigkeit hängt von der Dokumentqualität ab, aber die meisten strukturierten Dokumente wie Rechnungen und Belege erreichen hohe Extraktionsraten.
Ja. Der kostenlose Tarif umfasst 100 Seiten pro Monat mit vollem API-Zugriff, benutzerdefinierten Schemata und allen unterstützten Dateiformaten. Für den Einstieg ist keine Kreditkarte erforderlich.
Für die Stapelverarbeitung nutzen Sie den asynchronen Extraktions-Endpunkt. Reichen Sie Dokumente ein und fragen Sie die Ergebnisse per Polling ab, oder nutzen Sie Webhooks, um benachrichtigt zu werden, wenn die Extraktion abgeschlossen ist. Der Pro-Tarif unterstützt 5.000 Seiten pro Monat mit bevorzugter Verarbeitung.
Holen Sie sich Ihren API-Schlüssel und extrahieren Sie in wenigen Minuten Daten aus Ihrem ersten Dokument. 100 Seiten pro Monat kostenlos - keine Kreditkarte erforderlich.