Esta API é uma ferramenta de OCR (Reconhecimento Óptico de Caracteres). Qualquer imagem que você enviar será examinada e extrairá todas as palavras contidas nela.
Você precisará passar a URL da imagem de sua escolha. E você receberá o conteúdo de texto que ela contém. É uma API muito intuitiva e você ficará impressionado com os resultados.
Esta API é ideal para empresas que armazenam muitas imagens e desejam recuperar o texto que elas contêm. Isso ajudará você a reconhecer se sua marca está sendo usada em imagens na web sem autorização.
Além disso, esta API ajudará a categorizar essas imagens com texto. Graças ao reconhecimento de caracteres, você receberá as palavras completas e poderá detectar a categoria da imagem apenas lendo seu texto.
Além das limitações de chamadas de API por mês, todos os planos funcionam da mesma forma!
Com este endpoint, você receberá o texto dentro da imagem que você passar para ele.
Somente com a URL da imagem, você será capaz de extrair todo o texto em formato JSON.
A imagem deve ser uma imagem JPEG ou PNG regular (com ou sem transparência). Geralmente, tais imagens têm extensões: .jpg, .jpeg, .png. O serviço verifica os arquivos de entrada pelo tipo MIME e aceita os seguintes tipos:
image/jpegimage/pngO tamanho do arquivo de imagem deve ser menor que 16Mb
Análise de Imagem - Recursos do endpoint
| Objeto | Descrição |
|---|---|
url |
[Obrigatório] The URL of the image you want to extract the text from. Remember that only JPG, JPEG and PNG are supported. |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://file.io/GiqYoEWsoy9i","md5":"d4438cf64b5544dc22854b6585d8c398","width":2160,"height":3840,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.11990740740740741,0.019010416666666665,0.8467592592592592,0.89453125],"entities":[{"kind":"text","name":"text","text":"تحديات تؤثر على خدمة الذكاء الاصطناعى للغة العربية - التشكيل\nC\n00\nه استخدام القرآن الكريم\nيعتبر القرآن الكريم أكبر\nمصدر للغة العربية ولكن\nيصعب في بعض الأحيان\nاستخدامه في تدريب نماذج\nالذكاء الاصطناعي لتجنب\nتحريف المعنى. هناك بعض\nالنماذج التي تم تدريبها\nعلى القرآن الكريم، ولكن لم\nتزل هناك حاجة للمزيد من\nالجهود في هذا المجال.\nقه الكتابة من اليمين إلى اليسار\nتكتب اللغة العربية من اليمين إلى اليسار، وهذا يشكل تحديا في تطوير\nنماذج الذكاء الاصطناعي القادرة على الفهم والتعامل مع هذا النوع\nمن اللغات، مع أن هناك بعض النماذج التى تم تدريبها على الكتابة\nمن اليمين إلى اليسار، ولكن لم تزل هناك تحسينات مطلوبة لجعلها\nأكثر قبولاً وفعالية.\nوم الأرقام العربية\n09\nولّدت الأرقام العربية على أنها أرقام إنجليزية، فالرقم . (صفر) من\nالصعب توليده في الذكاء الاصطناعي، إذ يعتقد أنه عبارة عن نقطة."}]}]}]}]}
curl --location --request POST 'https://zylalabs.com/api/37/optical+character+recognition+api/108/image+analysis?url=https://storage.googleapis.com/api4ai-static/samples/ocr-1.png' --header 'Authorization: Bearer YOUR_API_KEY'
Para usar este endpoint, a imagem deve ser uma imagem JPEG ou PNG normal (com ou sem transparência). Normalmente, essas imagens têm as extensões: .jpg, .jpeg, .png. O serviço verifica o arquivo de entrada pelo tipo MIME e aceita os seguintes tipos:
image/jpeg
image/png
O tamanho do arquivo de imagem deve ser inferior a 16 Mb.
Análise de Imagem com arquivo - Recursos do endpoint
| Objeto | Descrição |
|---|---|
Corpo da requisição |
[Obrigatório] Arquivo binário |
{"results":[{"status":{"code":"ok","message":"Success"},"name":"https://gopostr.s3.amazonaws.com/binary_file_test_1679/tEMRXL7fQiIgoCXMcQ7UUWHcyqtYa4IeTb1NoAyt.jpg","md5":"f556d7e2b92037ea8b6af4d731597f1d","width":464,"height":479,"entities":[{"kind":"objects","name":"text","objects":[{"box":[0.4547413793103448,0.6868475991649269,0.44396551724137934,0.16075156576200417],"entities":[{"kind":"text","name":"text","text":"10\nAFA\nSAVE THE\nPLONET"}]}]}]}]}
curl --location 'https://zylalabs.com/api/37/optical+character+recognition+api/1679/image+analysis+with+file' \
--header 'Content-Type: application/x-www-form-urlencoded' \
--form 'image=@"FILE_PATH"'
| Cabeçalho | Descrição |
|---|---|
Authorization
|
[Obrigatório] Deve ser Bearer access_key. Veja "Sua chave de acesso à API" acima quando você estiver inscrito. |
Sem compromisso de longo prazo. Faça upgrade, downgrade ou cancele a qualquer momento. O teste gratuito inclui até 50 requisições.
Cada ponto final retorna texto extraído da imagem fornecida em formato JSON A resposta inclui detalhes como o status da solicitação a URL da imagem dimensões e o texto reconhecido junto com suas coordenadas da caixa delimitadora
Os campos-chave na resposta incluem "status" (indicando sucesso ou falha) "name" (URL da imagem) "width" e "height" (dimensões) e "entities" (que contém o texto reconhecido e sua posição na imagem)
Os dados da resposta estão estruturados como um objeto JSON contendo um array "resultados" Cada resultado inclui metadados sobre a imagem e um array "entidades" que detalha o texto reconhecido e suas coordenadas de caixa delimitadora
Cada ponto de extremidade fornece informações sobre o texto extraído de imagens, incluindo as palavras reconhecidas, suas posições e as dimensões gerais da imagem Isso pode ser útil para análise e categorização de texto
Casos de uso típicos incluem digitalizar documentos impressos monitorar o uso da marca em imagens e categorizar imagens com base no texto que contêm As empresas podem usar esses dados para gerenciamento de conteúdo e conformidade
Os usuários podem utilizar os dados retornados analisando a resposta JSON para extrair o texto reconhecido e suas coordenadas Essas informações podem ser usadas para análise adicional indexação ou integração em aplicativos para funcionalidade aprimorada
Os endpoints aceitam um único parâmetro: a URL da imagem ou o próprio arquivo de imagem. A imagem deve estar no formato JPEG ou PNG e ter menos de 16 MB de tamanho. Certifique-se de que o tipo MIME corresponda aos formatos aceitos para um processamento bem-sucedido
A precisão dos dados é mantida através do uso de algoritmos avançados de OCR que analisam o conteúdo da imagem A API é projetada para lidar com vários estilos e layouts de texto garantindo a extração confiável de texto de diversas fontes de imagem
Nível de serviço:
100%
Tempo de resposta:
10.469ms
Nível de serviço:
100%
Tempo de resposta:
1.942ms
Nível de serviço:
100%
Tempo de resposta:
1.971ms
Nível de serviço:
100%
Tempo de resposta:
1.245ms
Nível de serviço:
100%
Tempo de resposta:
2.450ms
Nível de serviço:
100%
Tempo de resposta:
4.649ms
Nível de serviço:
100%
Tempo de resposta:
1.076ms
Nível de serviço:
100%
Tempo de resposta:
211ms
Nível de serviço:
100%
Tempo de resposta:
810ms
Nível de serviço:
50%
Tempo de resposta:
787ms
Nível de serviço:
100%
Tempo de resposta:
744ms
Nível de serviço:
100%
Tempo de resposta:
1.035ms
Nível de serviço:
100%
Tempo de resposta:
1.033ms
Nível de serviço:
100%
Tempo de resposta:
579ms
Nível de serviço:
67%
Tempo de resposta:
1.982ms
Nível de serviço:
100%
Tempo de resposta:
620ms
Nível de serviço:
100%
Tempo de resposta:
585ms
Nível de serviço:
100%
Tempo de resposta:
1.448ms
Nível de serviço:
100%
Tempo de resposta:
990ms
Nível de serviço:
50%
Tempo de resposta:
1.321ms