PythonでPDFのテキストを手っ取り早く抽出してCSV化する方法です。 tabulaモジュールを利用すると、簡単にできます。 Javaが必須 tabulaを利用するにはJavaが必須なので先にインストールしておく。 tabulaのインストール pipでtabulaをインストールします。Jupyter ...
tabula.read_pdfでPDFから表を抜き出すのに苦労したので思い出しながらまとめます。 tabula.read_pdfとは PythonのモジュールでPDFファイルから表を抽出する事ができます。他にもPDFからを読み取るモジュールはありますがtabulaは表の抽出に特化しているらしいです ...