[Инструмент Python] Руководство по установке камелота для извлечения таблицы в формате pdf

искусственный интеллект Python

Учебное пособие по установке камелота для извлечения PDF-формы

После тестирования и macos, и win10 можно установить следующим образом

Camelot: удобный инструмент для извлечения данных из таблиц PDF

Инструмент командной строки Python, который упрощает извлечение табличных данных из файлов PDF.

Как использовать Камелот

С Camelot легко извлекать данные из PDF-документов

.Camelot позволяет точно контролировать процесс извлечения данных, регулируя настройки

.Плохие таблицы могут быть идентифицированы на основе пробелов и метрик точности и удалены без необходимости ручной проверки.

.Каждые табличные данные представляют собой кадр данных panda, который можно легко интегрировать в рабочий процесс ETL и анализа данных.

. Может ли данные экспорта на различные форматы, такие как CSV, JSON, Excel, HTML

  • инструкция по установке пипа:

Сначала установите python3.6 на компьютер, а затем введите в командную строку:

pip install camelot-py
  • Введите тест командной строки python
(CLOT) C:\Users\yss>python
Python 3.6.7 |Anaconda, Inc.| (default, Oct 28 2018, 19:44:12) [MSC v.1915 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import camelot as cl
......
    import chardet  # For str encoding detection in Py3
ModuleNotFoundError: No module named 'chardet'
>>>

Если сообщается об ошибке, как указано выше: Нет модуля с именем «chardet», вернитесь в системную командную строку и выполните:

pip install chardet

После успешной установки chardet снова введите команду python test:

(CLOT) C:\Users\yss>python
Python 3.6.7 |Anaconda, Inc.| (default, Oct 28 2018, 19:44:12) [MSC v.1915 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import camelot as cl
  File "F:\APP\Ides\Anaconda3\envs\CLOT\lib\site-packages\camelot\image_processing.py", line 5, in <module>
    import cv2
ModuleNotFoundError: No module named 'cv2'
>>>

Ошибка: ModuleNotFoundError: нет модуля с именем «cv2», это связано с тем, что библиотека opencv не установлена.
Снова вернитесь в системную командную строку и установите библиотеку opencv:

pip install opencv-python

После выполнения вышеуказанных операций установка успешна.

  • Установка прошла успешно, проверьте

Введите python еще раз и введите:

import camelot as cl

Нет больше ошибок.
Выведите номер его версии:

print(cl.__version__)

Процесс тестирования выглядит следующим образом:

(CLOT) C:\Users\yss>python
Python 3.6.7 |Anaconda, Inc.| (default, Oct 28 2018, 19:44:12) [MSC v.1915 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> import camelot as cl
>>> cl.__version__
'0.3.2'
>>>

После того, как установка будет завершена, тогда начнется запуск, шанс позади, и я также обновлю опыт.