私はサポートエンジニアになりたい

元教師・現開発エンジニアの挑戦

Google Colaboratoryでエラーを出さずにpandas-profilingを使う

Google Colaboratoryでpandas-profilingを使うためのサンプルコードです。
Google Drive内のcsvファイルに対してpandas-profilingを実行したときを想定しています。

サンプルコード

Google Colaboratory上にpandas-profilingの実行結果を出力する

!pip install markupsafe==2.0.1

#実行後に[y]をクリックし、処理終了後に[RESTART RUNTIME]と出るのでクリックする
!pip uninstall pandas_profiling
!pip install git+https://github.com/pandas-profiling/pandas-profiling.git

import pandas as pd
import pandas_profiling as pdp

#GoogleDrive マウント コラボ側がこう使ってくれと用意しているもの
from google.colab import drive
drive.mount('/content/drive')

#ここではGoogleDriveのマイドライブにtrain.csvとある場合を想定しています。必要に応じてパスを変更してください
train = pd.read_csv('/content/drive/MyDrive/train.csv')
pdp.ProfileReport(train)

Google Colaboratory上でpandas-profilingを実行し、HTML形式で出力する

!pip install markupsafe==2.0.1

#実行後に[y]をクリックし、処理終了後に[RESTART RUNTIME]と出るのでクリックする
!pip uninstall pandas_profiling
!pip install git+https://github.com/pandas-profiling/pandas-profiling.git

import pandas as pd
import pandas_profiling as pdp

#GoogleDrive マウント コラボ側がこう使ってくれと用意しているもの
from google.colab import drive
drive.mount('/content/drive')

#ここではGoogleDriveのマイドライブにtrain.csvとある場合を想定しています。必要に応じてパスを変更してください
train = pd.read_csv('/content/drive/MyDrive/train.csv')
profile = pdp.ProfileReport(train)

#Google Driveのマイドライブに「profile.html」という名前で出力します。Google Driveからダウンロードした「profile.html」をダブルクリックすると、pandas-profilingを使った結果がブラウザで確認できます。
profile.to_file("profile.html")

参考

clione.online
import pandas_profiling as pdpで以下のエラーが出たときの対処法

ImportError: cannot import name ‘soft_unicode’ from ‘markupsafe’


yurukaiha.hatenablog.com
pdp.ProfileReport(train)に以下のエラーが出たときの対処法

TypeError: concat() got an unexpected keyword argument 'join_axes'

Google colabにインストールされているpandas-profilingのバージョンが古いことが原因で起こるエラーです。
なので、pandas-profilingのアップグレードやGithubから最新バージョンをインストールが必要。