A API de OCR de Imagem para Texto permite que você converta imagens contendo texto em dados estruturados que podem ser processados e analisados digitalmente. Sua função principal é identificar automaticamente palavras, linhas e blocos de texto dentro de uma imagem, fornecendo não apenas o conteúdo textual, mas também informações sobre a localização exata de cada elemento dentro da imagem usando coordenadas de caixas delimitadoras. Isso facilita tarefas como extração de dados de documentos, passaportes, faturas, formulários ou qualquer imagem contendo texto.
Cada palavra reconhecida pela API inclui um valor de confiança que indica a probabilidade de que o reconhecimento esteja correto, permitindo que você filtre ou revise os resultados com base em sua precisão. A API organiza as informações de maneira hierárquica: os textos são agrupados em blocos, os blocos contêm parágrafos e os parágrafos contêm linhas e palavras individuais. Essa estrutura facilita a análise de documentos complexos e mantém o contexto do texto extraído.
Além da transcrição textual, a API pode capturar informações de formatação, como pontuação, capitalização e separações de palavras, e pode fornecer metadados úteis para processamento de documentos, busca e aplicações de análise automatizada. A saída inclui coordenadas normalizadas (valores entre 0 e 1) representando a posição do texto na imagem, permitindo a reconstrução visual do conteúdo ou integração com sistemas de marcação e anotação.
A API é particularmente útil em cenários onde documentos físicos ou digitalizados precisam ser digitalizados, processos de entrada de dados precisam ser automatizados, ou sistemas de leitura de documentos precisam ser construídos para auditoria, controle de identidade ou gerenciamento de documentos. Sua abordagem modular e detalhada permite tanto a extração rápida de texto quanto uma análise mais profunda, incluindo a validação de dados sensíveis, como nomes, números de identificação e datas, conforme visto em um exemplo de reconhecimento de passaporte haitiano, onde nomes, datas e códigos são extraídos de maneira hierárquica e detalhada.
Em resumo, esta API combina reconhecimento óptico de caracteres, precisão na localização de cada palavra e estrutura hierárquica para converter imagens em dados textuais confiáveis e acionáveis.
Converte imagens em texto detecta palavras linhas e blocos fornecendo coordenadas confiança e estrutura hierárquica do conteúdo visual
Extração de texto - Recursos do endpoint
| Objeto | Descrição |
|---|---|
image_url |
[Obrigatório] Enter a image URL |
{"status":true,"text":": AYITI: am PASPO re Py asia Etat oa ta PASSEPORT Aalto! Type ne f : BEB aon HTL 920000018 CHERUBIN Nea! Priam Kote 1 it! Lieu ce reetcceras NIRKA PORT~AU-PRINCE Moun bs reve‘ Rabongate HAITIENNE Oat H M41! Date ds calecance 6 MAI 1962 Fi catyer green! Seer FEMININ Gat peeps » set Dots Senissinn SIVAT) MET PASPO 4 17 DECEMBRE 1992 MSIGNGTURE Ou TITULAIRE amt parno 3 tn Dots Pespirotca 16 DECEMBRE 1997 920000018 SPECIMEN","boxCoordinates":[0.1197110423116615,0.05071315372424723,0.8421052631578947,0.8557844690966719],"blocks":[{"paragraphs":[{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]}],"boxCoordinates":[0,0,0,0]}],"boxCoordinates":[0,0,0,0]},{"paragraphs":[{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]}],"boxCoordinates":[0,0,0,0]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":": AYITI: am","words":[{"text":":","boxCoordinates":[0.20227038183694532,0.08240887480190175,0.0030959752321981426,0.003169572107765452],"confidence":0.0},{"text":"AYITI:","boxCoordinates":[0.6945304437564499,0.05071315372424723,0.0608875128998968,0.06497622820919176],"confidence":0.0},{"text":"am","boxCoordinates":[0.762641898864809,0.06656101426307448,0.048503611971104234,0.07131537242472266],"confidence":46.0}],"boxCoordinates":[0.20227038183694532,0.05071315372424723,0.608875128998968,0.08716323296354993]},{"text":"PASPO re Py asia Etat","words":[{"text":"PASPO","boxCoordinates":[0.15067079463364294,0.08557844690966719,0.06398348813209494,0.05705229793977813],"confidence":87.0},{"text":"re","boxCoordinates":[0.5479876160990712,0.11727416798732171,0.022703818369453045,0.017432646592709985],"confidence":21.0},{"text":"Py","boxCoordinates":[0.5851393188854489,0.12519809825673534,0.009287925696594427,0.030110935023771792],"confidence":46.0},{"text":"asia","boxCoordinates":[0.608875128998968,0.10935023771790808,0.04953560371517028,0.05229793977812995],"confidence":32.0},{"text":"Etat","boxCoordinates":[0.6656346749226006,0.10935023771790808,0.034055727554179564,0.039619651347068144],"confidence":13.0}],"boxCoordinates":[0.15067079463364294,0.08557844690966719,0.5490196078431373,0.07606973058637084]},{"text":"oa ta","words":[{"text":"oa","boxCoordinates":[0.5954592363261094,0.11410459587955626,0.02476780185758514,0.06497622820919176],"confidence":25.0},{"text":"ta","boxCoordinates":[0.6336429308565531,0.14580031695721077,0.02476780185758514,0.01901743264659271],"confidence":29.0}],"boxCoordinates":[0.5954592363261094,0.11410459587955626,0.0629514963880289,0.06497622820919176]}],"boxCoordinates":[0.15067079463364294,0.05071315372424723,0.6604747162022704,0.12836767036450078]}],"boxCoordinates":[0.15067079463364294,0.05071315372424723,0.6604747162022704,0.12836767036450078]},{"paragraphs":[{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]}],"boxCoordinates":[0,0,0,0]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":"PASSEPORT Aalto! Type ne f :","words":[{"text":"PASSEPORT","boxCoordinates":[0.1197110423116615,0.12678288431061807,0.11661506707946337,0.05229793977812995],"confidence":91.0},{"text":"Aalto!","boxCoordinates":[0.3632610939112487,0.14580031695721077,0.04231166150670795,0.01901743264659271],"confidence":0.0},{"text":"Type","boxCoordinates":[0.41382868937048506,0.14580031695721077,0.03199174406604747,0.022187004754358162],"confidence":88.0},{"text":"ne","boxCoordinates":[0.5108359133126935,0.11568938193343899,0.029927760577915376,0.0491283676703645],"confidence":47.0},{"text":"f","boxCoordinates":[0.5500515995872033,0.14580031695721077,0.0030959752321981426,0.01901743264659271],"confidence":18.0},{"text":":","boxCoordinates":[0.8224974200206399,0.1648177496038035,0.0030959752321981426,0.003169572107765452],"confidence":10.0}],"boxCoordinates":[0.1197110423116615,0.11568938193343899,0.7058823529411765,0.06339144215530904]},{"text":"BEB aon HTL 920000018","words":[{"text":"BEB","boxCoordinates":[0.3622291021671827,0.1901743264659271,0.04231166150670795,0.05388272583201268],"confidence":54.0},{"text":"aon","boxCoordinates":[0.4169246646026832,0.1838351822503962,0.02786377708978328,0.08399366085578447],"confidence":27.0},{"text":"HTL","boxCoordinates":[0.5696594427244582,0.19334389857369255,0.04437564499484004,0.03169572107765452],"confidence":40.0},{"text":"920000018","boxCoordinates":[0.7275541795665634,0.19175911251980982,0.14138286893704852,0.03645007923930269],"confidence":95.0}],"boxCoordinates":[0.3622291021671827,0.1838351822503962,0.5067079463364293,0.08399366085578447]}],"boxCoordinates":[0.1197110423116615,0.11568938193343899,0.7492260061919505,0.15213946117274169]}],"boxCoordinates":[0.1197110423116615,0.11568938193343899,0.7492260061919505,0.15213946117274169]},{"paragraphs":[{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]}],"boxCoordinates":[0,0,0,0]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":"CHERUBIN","words":[{"text":"CHERUBIN","boxCoordinates":[0.3622291021671827,0.24722662440570523,0.1259029927760578,0.03486529318541997],"confidence":90.0}],"boxCoordinates":[0.3622291021671827,0.24722662440570523,0.1259029927760578,0.03486529318541997]}],"boxCoordinates":[0.3622291021671827,0.24722662440570523,0.1259029927760578,0.03486529318541997]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":"Nea! Priam Kote 1 it! Lieu ce reetcceras","words":[{"text":"Nea!","boxCoordinates":[0.36119711042311664,0.29635499207606975,0.03508771929824561,0.022187004754358162],"confidence":32.0},{"text":"Priam","boxCoordinates":[0.40350877192982454,0.29160063391442154,0.048503611971104234,0.02377179080824089],"confidence":28.0},{"text":"Kote","boxCoordinates":[0.7481940144478845,0.29952456418383516,0.043343653250773995,0.01901743264659271],"confidence":60.0},{"text":"1","boxCoordinates":[0.7884416924664602,0.2884310618066561,0.006191950464396285,0.04595879556259905],"confidence":39.0},{"text":"it!","boxCoordinates":[0.803921568627451,0.29952456418383516,0.02063983488132095,0.01901743264659271],"confidence":0.0},{"text":"Lieu","boxCoordinates":[0.8297213622291022,0.3011093502377179,0.026831785345717233,0.017432646592709985],"confidence":0.0},{"text":"ce","boxCoordinates":[0.8637770897832817,0.3058637083993661,0.015479876160990712,0.012678288431061807],"confidence":48.0},{"text":"reetcceras","boxCoordinates":[0.8885448916408669,0.3074484944532488,0.06604747162022703,0.011093502377179081],"confidence":0.0}],"boxCoordinates":[0.36119711042311664,0.2884310618066561,0.5933952528379773,0.04595879556259905]},{"text":"NIRKA PORT~AU-PRINCE","words":[{"text":"NIRKA","boxCoordinates":[0.36119711042311664,0.3248811410459588,0.07946336429308566,0.03169572107765452],"confidence":91.0},{"text":"PORT~AU-PRINCE","boxCoordinates":[0.7430340557275542,0.329635499207607,0.21878224974200206,0.03486529318541997],"confidence":0.0}],"boxCoordinates":[0.36119711042311664,0.3248811410459588,0.6006191950464397,0.039619651347068144]},{"text":"Moun bs reve‘ Rabongate","words":[{"text":"Moun","boxCoordinates":[0.36119711042311664,0.37083993660855785,0.038183694530443756,0.020602218700475437],"confidence":68.0},{"text":"bs","boxCoordinates":[0.4086687306501548,0.37400950871632327,0.010319917440660475,0.01584786053882726],"confidence":53.0},{"text":"reve‘","boxCoordinates":[0.4262125902992776,0.36450079239302696,0.038183694530443756,0.04120443740095087],"confidence":17.0},{"text":"Rabongate","boxCoordinates":[0.46852425180598556,0.36450079239302696,0.07223942208462332,0.04120443740095087],"confidence":0.0}],"boxCoordinates":[0.36119711042311664,0.36450079239302696,0.17956656346749225,0.04120443740095087]}],"boxCoordinates":[0.36119711042311664,0.2884310618066561,0.6006191950464397,0.11727416798732171]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":"HAITIENNE","words":[{"text":"HAITIENNE","boxCoordinates":[0.36119711042311664,0.40253565768621236,0.14138286893704852,0.03486529318541997],"confidence":91.0}],"boxCoordinates":[0.36119711042311664,0.40253565768621236,0.14138286893704852,0.03486529318541997]}],"boxCoordinates":[0.36119711042311664,0.40253565768621236,0.14138286893704852,0.03486529318541997]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":"Oat H M41! Date ds calecance","words":[{"text":"Oat","boxCoordinates":[0.36119711042311664,0.4469096671949287,0.023735810113519093,0.017432646592709985],"confidence":72.0},{"text":"H","boxCoordinates":[0.3931888544891641,0.4500792393026941,0.008255933952528379,0.014263074484944533],"confidence":0.0},{"text":"M41!","boxCoordinates":[0.40970072239422084,0.44532488114104596,0.02476780185758514,0.020602218700475437],"confidence":0.0},{"text":"Date","boxCoordinates":[0.43962848297213625,0.4500792393026941,0.033023735810113516,0.017432646592709985],"confidence":70.0},{"text":"ds","boxCoordinates":[0.478844169246646,0.44849445324881143,0.015479876160990712,0.020602218700475437],"confidence":68.0},{"text":"calecance","boxCoordinates":[0.5025799793601651,0.4532488114104596,0.06501547987616099,0.01584786053882726],"confidence":0.0}],"boxCoordinates":[0.36119711042311664,0.44532488114104596,0.20639834881320948,0.02377179080824089]}],"boxCoordinates":[0.36119711042311664,0.44532488114104596,0.20639834881320948,0.02377179080824089]},{"lines":[{"text":"","words":[],"boxCoordinates":[0,0,0,0]},{"text":"6 MAI 1962","words":[{"text":"6","boxCoordinates":[0.36119711042311664,0.48019017432646594,0.015479876160990712,0.03328050713153724],"confidence":94.0},{"text":"MAI","boxCoordinates":[0.3931888544891641,0.48019017432646594,0.04540763673890609,0.03328050713153724],"confidence":94.0},{"text":"1962","boxCoordinates":[0.45717234262125905,0.4786053882725832,0.06191950464396285,0.03645007923930269],"confidence":95.0}],"boxCoordinates":[0.36119711042311664,0.4786053882725832,0.15789473684210525,0.03645007923930269]}],"boxCoordinates":[0.36119711042311664,0.4786053882725832,0.15789473684210525,0.03645007923930269]}]}],"_note":"Response truncated for documentation purposes"}
curl --location --request POST 'https://zylalabs.com/api/11232/image+to+text+ocr+api/21227/text+extraction?image_url=https://static-content.regulaforensics.com/Hardware-products/knowledge_hub/glossary_documents/PASSPORT/2l.webp' --header 'Authorization: Bearer YOUR_API_KEY'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
O endpoint de extração de texto retorna dados estruturados que incluem texto reconhecido, coordenadas da caixa delimitadora para cada palavra, linha e bloco, pontuações de confiança indicando a precisão do reconhecimento, e uma organização hierárquica do texto (blocos, parágrafos, linhas, palavras)
Os campos-chave nos dados de resposta incluem "texto" (o conteúdo reconhecido) "coordenadas" (posições da caixa delimitadora) "confiança" (pontuação de precisão) e "hierarquia" (estrutura que indica blocos parágrafos linhas e palavras)
Os dados da resposta estão organizados hierarquicamente, com blocos contendo parágrafos, parágrafos contendo linhas e linhas contendo palavras individuais. Esta estrutura permite uma fácil navegação e análise do texto extraído
O ponto final fornece informações como texto reconhecido sua localização dentro da imagem níveis de confiança para cada reconhecimento e detalhes de formatação como pontuação e capitalização tornando-o adequado para vários tipos de documentos
Os usuários podem personalizar suas solicitações especificando parâmetros como formato de imagem configurações de idioma e estrutura de saída desejada permitindo uma extração personalizada com base em tipos ou requisitos de documentos específicos
A precisão dos dados é mantida por meio de algoritmos avançados de reconhecimento óptico de caracteres que incluem pontuação de confiança para cada elemento reconhecido permitindo que os usuários filtrem os resultados com base em sua confiabilidade
Casos de uso típicos incluem digitalizar documentos escaneados automatizar a entrada de dados de formulários ou faturas e construir sistemas de leitura de documentos para verificação de identidade ou fins de auditoria
Os usuários devem verificar os scores de confiança na resposta scores baixos podem indicar resultados parciais ou imprecisos Implementar um processo de revisão para entradas de baixa confiança pode ajudar a garantir a qualidade e a completude dos dados
Nível de serviço:
100%
Tempo de resposta:
1.971ms
Nível de serviço:
100%
Tempo de resposta:
1.076ms
Nível de serviço:
100%
Tempo de resposta:
1.855ms
Nível de serviço:
100%
Tempo de resposta:
1.245ms
Nível de serviço:
100%
Tempo de resposta:
1.812ms
Nível de serviço:
100%
Tempo de resposta:
3.168ms
Nível de serviço:
100%
Tempo de resposta:
4.649ms
Nível de serviço:
100%
Tempo de resposta:
810ms
Nível de serviço:
100%
Tempo de resposta:
1.942ms
Nível de serviço:
100%
Tempo de resposta:
1.429ms
Nível de serviço:
100%
Tempo de resposta:
1.280ms
Nível de serviço:
100%
Tempo de resposta:
784ms
Nível de serviço:
100%
Tempo de resposta:
894ms
Nível de serviço:
100%
Tempo de resposta:
5.305ms
Nível de serviço:
100%
Tempo de resposta:
1.682ms
Nível de serviço:
100%
Tempo de resposta:
8.825ms
Nível de serviço:
100%
Tempo de resposta:
327ms
Nível de serviço:
100%
Tempo de resposta:
255ms
Nível de serviço:
100%
Tempo de resposta:
68ms
Nível de serviço:
100%
Tempo de resposta:
16ms