Qu'est-ce que l'OCR ?
L'OCR (Optical Character Recognition) est une technologie qui analyse une image et en extrait les caractères textuels. ConvertiZen utilise Tesseract.js, le moteur OCR open-source le plus avancé, compilé en WebAssembly pour fonctionner 100% dans votre navigateur.
FAQ
Quelles langues sont supportées par l'OCR ?
Français, anglais, espagnol, allemand et plus de 50 autres langues.
L'OCR fonctionne-t-il sur des scans de mauvaise qualité ?
Les résultats sont meilleurs sur des scans nets. Essayez d'améliorer le contraste.
Mes images sont-elles envoyées sur un serveur pour l'OCR ?
Non, l'OCR s'exécute localement via Tesseract.js WebAssembly.
Puis-je faire de l'OCR sur un PDF scanné ?
Oui, ConvertiZen peut extraire le texte de PDFs issus de scanner.
La reconnaissance des tableaux est-elle supportée ?
Partiellement — le texte est extrait mais la structure tabulaire peut être perdue.