Extraiga datos estructurados de PDFs, facturas, recibos y formularios con una sola llamada a la API. Envíe cualquier documento y reciba un JSON limpio. Sin plantillas, sin datos de entrenamiento, sin archivos de configuración.
Envíe un documento al endpoint de extracción y reciba un JSON estructurado. Defina un esquema para controlar exactamente qué campos necesita, o deje que la API detecte automáticamente la estructura del documento.
curl -X POST \
https://api-parse.conversiontools.io/v1/extract \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@invoice.pdf" \
-F 'schema={
"vendor": "string",
"date": "string",
"total": "number",
"line_items": [{
"description": "string",
"amount": "number"
}]
}'{
"status": "completed",
"data": {
"vendor": "Acme Corp",
"date": "2026-03-01",
"total": 1250.00,
"line_items": [
{
"description": "Consulting services",
"amount": 1000.00
},
{
"description": "Expenses",
"amount": 250.00
}
]
}
}Tres pasos para pasar de un documento sin procesar a datos estructurados. Sin entrenamiento, sin plantillas - la API entiende sus documentos de forma automática.
Envíe cualquier PDF, imagen o documento escaneado al endpoint de la API. Admite facturas, recibos, formularios, contratos y más.
La API lee el documento, entiende su estructura y extrae los campos que solicitó en la definición de su esquema.
Reciba un JSON limpio y tipado que coincide con su esquema. Listo para almacenarlo en una base de datos, alimentar una canalización o mostrarlo en su aplicación.
Diseñado para desarrolladores que necesitan una extracción de datos fiable y precisa sin la complejidad de los flujos de OCR tradicionales.
Usa grandes modelos de lenguaje para entender el contexto y el diseño del documento. Gestiona formatos variados sin reglas personalizadas ni configuración de plantillas.
Un endpoint, una llamada a la API. Envíe un archivo y reciba JSON. Sin SDKs necesarios - funciona con curl, Python, Node.js o cualquier cliente HTTP.
Defina con esquemas JSON exactamente qué campos extraer. Compatibilidad con cadenas, números, fechas, arrays y objetos anidados. Reutilice esquemas entre documentos.
Procese PDFs, imágenes escaneadas, JPEGs, PNGs, GIF, WebP, TIFF, BMP, HEIC y archivos AVIF. Funciona con documentos digitales y escaneados en todos los idiomas.
Los archivos se procesan y eliminan de forma automática. No se almacenan datos del documento tras la extracción. Infraestructura alojada en la UE con conexiones cifradas.
La mayoría de los documentos de una sola página se procesan en segundos. Modos síncrono y asíncrono disponibles según su caso de uso y el tamaño del documento.
La mayoría de los documentos no son texto limpio de una sola columna. La API también lee los más complicados - tablas, escaneos y páginas que se extienden.
Reconoce datos tabulares, listas con viñetas, cláusulas numeradas y estructuras anidadas, y devuelve cada fila o elemento como un objeto tipado en un array JSON.
Extrae contenido impreso, mecanografiado y manuscrito de documentos escaneados, incluidas anotaciones y campos de formulario rellenados.
Procesa un documento completo en una sola llamada y mantiene el contexto entre páginas, de modo que los valores que abarcan encabezados, secciones y anexos vuelven juntos.
La misma API basada en esquemas funciona con cualquier tipo de documento. Defina un esquema una vez y extraiga datos de miles de archivos.
Convierta cualquier PDF en JSON estructurado, escaneado o digital.
Proveedor, líneas de detalle, totales, impuestos y fechas de las facturas.
Comercio, artículos, totales y método de pago de los recibos.
Número de pedido, proveedor, comprador y líneas de detalle a nivel de SKU.
Transacciones, saldos acumulados y fechas para la conciliación.
Datos a nivel de casilla de los formularios W-2, 1099 y otros formularios fiscales.
Partes, fechas, ley aplicable y cláusulas clave.
Transportista, partes, puertos, contenedores y carga.
Preguntas habituales sobre la API de extracción de datos.
Parse acepta archivos PDF, JPEG, PNG, GIF, WebP, TIFF, BMP, HEIC y AVIF. Puede extraer datos estructurados de documentos escaneados, PDFs digitales, fotos de recibos y cualquier documento basado en imágenes.
No. Parse usa IA para entender la estructura del documento de forma automática. Usted define un esquema JSON que describe los campos que desea, y la API los extrae de cualquier documento - sin plantillas, datos de entrenamiento ni archivos de configuración.
Parse usa grandes modelos de lenguaje para entender el contexto del documento, no solo la coincidencia de texto por OCR. Esto significa que gestiona diseños, idiomas y formatos variados. La precisión depende de la calidad del documento, pero la mayoría de los documentos estructurados como facturas y recibos logran altas tasas de extracción.
Sí. El plan gratuito incluye 100 páginas al mes con acceso completo a la API, esquemas personalizados y todos los formatos de archivo admitidos. No se necesita tarjeta de crédito para empezar.
Para el procesamiento por lotes, use el endpoint de extracción asíncrono. Envíe documentos y consulte los resultados por sondeo, o use webhooks para recibir una notificación cuando finalice la extracción. El plan Pro admite 5.000 páginas al mes con procesamiento prioritario.
Obtenga su clave de API y extraiga datos de su primer documento en minutos. 100 páginas al mes gratis - sin tarjeta de crédito.