Учебное пособие по установке камелота для извлечения PDF-формы
После тестирования и macos, и win10 можно установить следующим образом
Camelot: удобный инструмент для извлечения данных из таблиц PDF
Инструмент командной строки Python, который упрощает извлечение табличных данных из файлов PDF.
Как использовать Камелот
С Camelot легко извлекать данные из PDF-документов
.Camelot позволяет точно контролировать процесс извлечения данных, регулируя настройки
.Плохие таблицы могут быть идентифицированы на основе пробелов и метрик точности и удалены без необходимости ручной проверки.
.Каждые табличные данные представляют собой кадр данных panda, который можно легко интегрировать в рабочий процесс ETL и анализа данных.
. Может ли данные экспорта на различные форматы, такие как CSV, JSON, Excel, HTML
- инструкция по установке пипа:
Сначала установите python3.6 на компьютер, а затем введите в командную строку:
pip install camelot-py
- Введите тест командной строки python
(CLOT) C:\Users\yss>python
Python 3.6.7 |Anaconda, Inc.| (default, Oct 28 2018, 19:44:12) [MSC v.1915 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import camelot as cl
......
import chardet # For str encoding detection in Py3
ModuleNotFoundError: No module named 'chardet'
>>>
Если сообщается об ошибке, как указано выше: Нет модуля с именем «chardet», вернитесь в системную командную строку и выполните:
pip install chardet
После успешной установки chardet снова введите команду python test:
(CLOT) C:\Users\yss>python
Python 3.6.7 |Anaconda, Inc.| (default, Oct 28 2018, 19:44:12) [MSC v.1915 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import camelot as cl
File "F:\APP\Ides\Anaconda3\envs\CLOT\lib\site-packages\camelot\image_processing.py", line 5, in <module>
import cv2
ModuleNotFoundError: No module named 'cv2'
>>>
Ошибка: ModuleNotFoundError: нет модуля с именем «cv2», это связано с тем, что библиотека opencv не установлена.
Снова вернитесь в системную командную строку и установите библиотеку opencv:
pip install opencv-python
После выполнения вышеуказанных операций установка успешна.
- Установка прошла успешно, проверьте
Введите python еще раз и введите:
import camelot as cl
Нет больше ошибок.
Выведите номер его версии:
print(cl.__version__)
Процесс тестирования выглядит следующим образом:
(CLOT) C:\Users\yss>python
Python 3.6.7 |Anaconda, Inc.| (default, Oct 28 2018, 19:44:12) [MSC v.1915 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import camelot as cl
>>> cl.__version__
'0.3.2'
>>>
После того, как установка будет завершена, тогда начнется запуск, шанс позади, и я также обновлю опыт.