[ tesseract ] - como fazer OCR em Python
Neste vídeo, vou ensinar a utilizar o Tesseract em Python para reconhecimento de texto em imagens. O Tesseract é uma poderosa biblioteca de OCR (Optical Character Recognition) que permite extrair texto de imagens de forma automática. Vou mostrar passo a passo como configurar o ambiente, instalar as dependências necessárias e, em seguida, utilizaremos o Tesseract juntamente com a biblioteca pytesseract para processar uma captura de tela e extrair o texto dela.
Para começar, utilizaremos a biblioteca fast_ctypes_screenshots para realizar a captura da tela. Em seguida, faremos a configuração do caminho para o executável do Tesseract utilizando a variável tesseract_cmd. É importante garantir que o caminho esteja correto para que o Tesseract funcione corretamente.
Utilizando o objeto ScreenshotOfOneMonitor, capturaremos a imagem de um monitor específico e a armazenaremos na variável img. A seguir, utilizaremos a função image_to_data do pytesseract para processar a imagem e extrair o texto. Neste exemplo, estamos configurando o idioma como inglês (lang="eng") e o tipo de saída como um DataFrame (output_type="data.frame"). A configuração pandas_config é utilizada para lidar com possíveis problemas durante o processamento.
Por fim, exibiremos o resultado no console utilizando a função print. O resultado será um DataFrame contendo informações sobre o texto identificado, como coordenadas, confiança e outros detalhes.
Espero que este tutorial seja útil para vocês! Se tiverem alguma dúvida ou sugestão, deixem nos comentários. Não se esqueçam de se inscrever no canal e ativar as notificações para acompanhar os próximos vídeos. O código utilizado estará disponível na descrição.
from fast_ctypes_screenshots import ScreenshotOfOneMonitor
from pytesseract import pytesseract
from PrettyColorPrinter import add_printer
add_printer(1)
pytesseract.tesseract_cmd = r"C:\Program Files\Tesseract-OCR\tesseract.exe"
with ScreenshotOfOneMonitor(monitor=1, ascontiguousarray=False) as screenshots_monitor:
img = screenshots_monitor.screenshot_one_monitor()
df = pytesseract.image_to_data(
img,
lang="eng",
output_type="data.frame",
pandas_config={"on_bad_lines": "warn"},
)
print(df)
Что делает видео по-настоящему запоминающимся? Наверное, та самая атмосфера, которая заставляет забыть о времени. Когда вы заходите на RUVIDEO, чтобы посмотреть онлайн «[ tesseract ] - como fazer OCR em Python», вы рассчитываете на нечто большее, чем просто загрузку плеера. И мы это понимаем. Контент такого уровня заслуживает того, чтобы его смотрели в HD 1080, без дрожания картинки и бесконечного буферизации.
Честно говоря, Rutube сегодня — это кладезь уникальных находок, которые часто теряются в общем шуме. Мы же вытаскиваем на поверхность самое интересное. Будь то динамичный экшн, глубокий разбор темы от любимого автора или просто уютное видео для настроения — всё это доступно здесь бесплатно и без лишних формальностей. Никаких «заполните анкету, чтобы продолжить». Только вы, ваш экран и качественный поток.
Если вас зацепило это видео, не забудьте взглянуть на похожие материалы в блоке справа. Мы откалибровали наши алгоритмы так, чтобы они подбирали контент не просто «по тегам», а по настроению и смыслу. Ведь в конечном итоге, онлайн-кинотеатр — это не склад файлов, а место, где каждый вечер можно найти свою историю. Приятного вам отдыха на RUVIDEO!
Видео взято из открытых источников Rutube. Если вы правообладатель, обратитесь к первоисточнику.