Pandasでデータ解析
欠損値のカウント
以下のコードで対象のDadatFrameに存在するNanも値をカウントできます。
df.isnull().sum()
欠損値の存在確認
以下のコードを利用することで欠損値が一つ以上存在する場合はTRUE,存在しない場合はFALSEを返します。
df.isnull().any(axis=1) #行に対してNanが存在すルカどうか
df.isnull().any(axis=0) #列に対して
ここで重要なのが”axis”です。これを0にした場合は列に対して,1の場合は行に対して、検索されます。
ソースコード
import pandas as pd
df = pd.read_csv('./c01.csv', encoding="shift-jis")
print(df.isnull().sum())
print(df.isnull().any(axis=1)) #行に対してNanが存在すルカどうか
print(df.isnull().any(axis=0)) #列に対して
print(df[df.isnull().any(axis=1)])