Установка OCR библиотек в Python
| Введение | |
| OpenCV | |
| Matplotlib | |
| Tesseract | |
| Похожие статьи |
Введение
Установка OpenCV
python -m pip install opencv-python
Collecting opencv-python Downloading opencv_python-4.7.0.72-cp37-abi3-win_amd64.whl (38.2 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 38.2/38.2 MB 16.8 MB/s eta 0:00:00 Collecting numpy>=1.21.2 (from opencv-python) Downloading numpy-1.25.0-cp311-cp311-win_amd64.whl (15.0 MB) ━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━ 15.0/15.0 MB 17.2 MB/s eta 0:00:00 Installing collected packages: numpy, opencv-python Successfully installed numpy-1.25.0 opencv-python-4.7.0.72
Установка Matplotlib
python -m pip install matplotlib
matplotlib) Using cached six-1.16.0-py2.py3-none-any.whl (11 kB) Installing collected packages: six, pyparsing, pillow, packaging, kiwisolver, fonttools, cycler, contourpy, python-dateutil, matplotlib Successfully installed contourpy-1.1.0 cycler-0.11.0 fonttools-4.40.0 kiwisolver-1.4.4 matplotlib-3.7.1 packaging-23.1 pillow-9.5.0 pyparsing-3.1.0 python-dateutil-2.8.2 six-1.16.0
Установка Tesseract
Библиотека для работы с
Tesseract
в Python называется pytesseract
Скорее всего pytesseract уже установлен как зависимость от предыдущих библиотек.
Если нет - то выполните
python -m pip install pytesseract
Requirement already satisfied: pytesseract in c:\users\andrei\venv\lib\site-packages (0.3.10) Requirement already satisfied: packaging>=21.3 in c:\users\andrei\venv\lib\site-packages (from pytesseract) (23.1) Requirement already satisfied: Pillow>=8.0.0 in c:\users\andrei\venv\lib\site-packages (from pytesseract) (9.5.0)
Установки pytesseract недостаточно - нужно скачать с официального сайта https://github.com/UB-Mannheim/tesseract/wiki всю библиотеку и установить её.
wget https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.1.20230401.exe
--2026-04-11 20:02:56-- https://digi.bib.uni-mannheim.de/tesseract/tesseract-ocr-w64-setup-5.3.1.20230401.exe Resolving digi.bib.uni-mannheim.de (digi.bib.uni-mannheim.de)... 134.155.36.52 Connecting to digi.bib.uni-mannheim.de (digi.bib.uni-mannheim.de)|134.155.36.52|:443... connected. HTTP request sent, awaiting response... 200 OK Length: 49945840 (48M) [application/x-msdos-program] Saving to: 'tesseract-ocr-w64-setup-5.3.1.20230401.exe' tesseract-ocr-w64-setup-5.3.1.20230401.e 100%[================================================================================>] 47.63M 19.1MB/s in 2.5s 2026-04-11 20:02:56 (19.1 MB/s) - 'tesseract-ocr-w64-setup-5.3.1.20230401.exe' saved [49945840/49945840]
C:\Users\Andrei\AppData\Local\Programs\Tesseract-OCR
Выберите язык и нажмите OK
https://devhops.ru
Нажмите Next
https://devhops.ru
Выберите раскладку клавиатуры
https://devhops.ru
Выберите способ подключения к интернету
https://devhops.ru
Могут предложить обновить установщик
https://devhops.ru
Если обновляете - дождитесь скачивания
https://devhops.ru
Когда обновление скачается кликните Install Ubuntu 24.04 LTS
https://devhops.ru
Заново выберите язык
https://devhops.ru
Выберите нужное и нажмите Next
https://devhops.ru
Установка Tesseract
Установка Tesseract
Установка Tesseract
Установка Tesseract
Установка Tesseract
Установка Tesseract
Установка Tesseract
Установка Tesseract
tesseract --version
tesseract v5.3.1.20230401 leptonica-1.83.1 libgif 5.2.1 : libjpeg 8d (libjpeg-turbo 2.1.4) : libpng 1.6.39 : libtiff 4.5.0 : zlib 1.2.13 : libwebp 1.3.0 : libopenjp2 2.5.0 Found AVX2 Found AVX Found FMA Found SSE4.1 Found libarchive 3.6.2 zlib/1.2.13 liblzma/5.2.9 bz2lib/1.0.8 liblz4/1.9.4 libzstd/1.5.2 Found libcurl/8.0.1 Schannel zlib/1.2.13 brotli/1.0.9 zstd/1.5.4 libidn2/2.3.4 libpsl/0.21.2 (+libidn2/2.3.3) libssh2/1.10.0
Пример
try: f = open('missing.txt') except Exception: print('ERR: File not found')
python try_except.py
РЕКЛАМА от Яндекса. Может быть недоступна в вашем регионе
Конец рекламы. Если там пусто считайте это рекламой моей телеги
Автор статьи: Андрей Олегович
| OCR | |
| Python | |
| OpenCV | |
| pillow | |
| pytesseract |