Récupérez les données par case des formulaires W-2, 1099 et autres formulaires fiscaux dans un JSON typé. Informations sur l’employeur et le bénéficiaire, chaque case numérotée, le type de formulaire et l’année fiscale - structurés et prêts pour un logiciel de déclaration ou de paie. Aucune saisie manuelle.
Déclarez les cases dont vous avez besoin et chacune revient sous forme de nombre typé avec le nom que vous avez choisi - aucun nettoyage OCR, aucune transcription.
curl -X POST \
https://api-parse.conversiontools.io/v1/extract \
-H "Authorization: Bearer YOUR_API_KEY" \
-F "file=@w2.pdf" \
-F 'schema={
"form_type": "string",
"tax_year": "number",
"employer": {
"name": "string",
"ein": "string",
"address": "string"
},
"employee": {
"name": "string",
"ssn_last4": "string"
},
"wages": "number",
"federal_income_tax_withheld": "number",
"social_security_wages": "number",
"social_security_tax_withheld": "number",
"medicare_wages": "number",
"medicare_tax_withheld": "number",
"state": "string",
"state_wages": "number",
"state_income_tax": "number"
}'{
"status": "completed",
"pages": 1,
"data": {
"form_type": "W-2",
"tax_year": 2025,
"employer": {
"name": "ACME Corp",
"ein": "12-3456789",
"address": "100 Main St, Austin, TX"
},
"employee": {
"name": "Jane Doe",
"ssn_last4": "6789"
},
"wages": 84500.00,
"federal_income_tax_withheld": 11230.00,
"social_security_wages": 84500.00,
"social_security_tax_withheld": 5239.00,
"medicare_wages": 84500.00,
"medicare_tax_withheld": 1225.25,
"state": "TX",
"state_wages": 84500.00,
"state_income_tax": 0.00
}
}Les formulaires fiscaux sont des grilles denses de cases numérotées. Le schéma les transforme en champs nommés et typés.
Chaque case numérotée est associée à un champ nommé, typé comme un nombre, de sorte que les totaux sont corrects sans passe de nettoyage OCR.
Un seul endpoint piloté par schéma pour tous les types de formulaire. Déclarez les champs dont vous avez besoin par formulaire - W-2, 1099-NEC, 1099-MISC, 1098 et plus encore.
Capturez uniquement ce dont vous avez besoin, comme les quatre derniers chiffres d’un numéro de sécurité sociale, et chaque fichier est supprimé automatiquement sous 24 heures.
W-2, 1099-NEC, 1099-MISC, 1099-INT, 1099-DIV, 1098, 1040 et d’autres. L’API est pilotée par schéma, vous décrivez donc les champs du formulaire que vous envoyez, quel qu’il soit.
Vous nommez les champs dans votre schéma (par exemple federal_income_tax_withheld) et le modèle associe la bonne case à chaque nom. Vous n’avez jamais affaire aux positions de case brutes.
Oui. L’OCR est appliqué automatiquement. Les formulaires imprimés sont lus avec la plus grande précision ; une écriture manuscrite nette est généralement reconnue, bien qu’une écriture très stylisée puisse être moins précise.
Oui. Utilisez le endpoint asynchrone pour soumettre de grands lots pendant la saison fiscale et récupérez les résultats par polling ou via des webhooks.
Les fichiers téléversés sont supprimés automatiquement sous 24 heures. Les données extraites sont chiffrées en transit et au repos et ne sont jamais utilisées pour entraîner des modèles.
La même API pilotée par schéma fonctionne pour tout type de document. Définissez un schéma une fois et extrayez des données de milliers de fichiers.
Extrayez du JSON structuré de n’importe quel document avec des schémas personnalisés.
Analysez n’importe quel PDF en JSON structuré, scanné ou numérique.
Fournisseur, lignes de détail, totaux, taxes et dates des factures.
Magasin, articles, totaux et mode de paiement des reçus.
Numéro de commande, fournisseur, acheteur et lignes de détail au niveau SKU.
Transactions, soldes courants et dates pour le rapprochement.
Parties, dates, droit applicable et clauses clés.
Transporteur, parties, ports, conteneurs y carga.
L’offre gratuite couvre vos 100 premières pages par mois. Aucune carte bancaire pour démarrer.