Він може виявляти та витягувати текст із зображення. Він має дві функції анотацій для підтримки OCR. 19 грудня 2023 р
Застосуйте розширення та використовуйте cv2. Функція findContours() для пошуку прямокутників із розширених зображень, ці прямокутники є просто абзацами. Використовуйте ці прямокутники в pytesseract. image_to_string() і витягніть текст, а потім додайте витягнутий текст і координати прямокутника до cnt_list.
Пакет OpenCV використовується для читання зображення та виконання певних методів обробки зображення. Python-tesseract — це оболонка для механізму Google Tesseract-OCR, який використовується для розпізнавання тексту із зображень.
Щоб скопіювати текст із зображення за допомогою OCR, виконайте такі дії:
- Відкрийте програму OCR, щоб відсканувати документ.
- Зачекайте, доки ваша програма не запропонує сканувати або розпізнає текст.
- Відскануйте зображення.
- Відредагуйте або витягніть текст із документа.
Як витягти текст із зображень за допомогою Python
- Крок 1. Завантажте та інсталюйте Python.
- Крок 2. Завантажте та встановіть Tesseract.
- Крок 3. Встановіть пакети Pillow і pytesseract.
- Крок 4. Напишіть код на Python, щоб отримати текст із зображень.
- Крок 1. Встановіть необхідні пакети Python.
- Крок 2 Напишіть код Python для використання EasyOCR.
Для початку ми застосуємо текстовий детектор OpenCV EAST, щоб визначити присутність тексту на зображенні. Детектор тексту EAST надасть нам координати обмежувальної рамки (x, y) текстових ROI. Ми витягнемо кожну з цих ROI, а потім передамо їх Алгоритм глибокого навчання розпізнавання тексту LSTM Tesseract v4.
Метод OpenCV-Python використовується для малювання текстового рядка на будь-якому зображенні. Синтаксис: cv2. putText(image, text, org, font, fontScale, color[, thickness[, lineType[, bottomLeftOrigin]]]) Параметри:image: це зображення, на якому буде намальовано текст. text: текстовий рядок для малювання.