[解決済み] Python Pandas 特定の値の出現回数を数える

2023-02-17 10:39:53

質問

ある列の中にある値が何回現れるかを調べたい。

でデータフレームを作りました。 data = pd.DataFrame.from_csv('data/DataSet2.csv')

でデータフレームを作成したのですが、ある列に何かが現れた回数を調べたいのです。これはどのように行われますか？

私は下のように、教育欄を見て回数を数えているのだと思いました。 ? が発生する。

以下のコードでは、何回目の 9th が表示される回数を調べようとしており、コードを実行するとこのようなエラーが発生します。

コード

missing2 = df.education.value_counts()['9th']
print(missing2)

エラー

KeyError: '9th'

どのように解決するのですか？

あなたは subset を作成し shape または len :

print df
  col1 education
0    a       9th
1    b       9th
2    c       8th

print df.education == '9th'
0     True
1     True
2    False
Name: education, dtype: bool

print df[df.education == '9th']
  col1 education
0    a       9th
1    b       9th

print df[df.education == '9th'].shape[0]
2
print len(df[df['education'] == '9th'])
2

パフォーマンスは興味深いもので、最速の解決策はnumpy配列と sum :

コード :

import perfplot, string
np.random.seed(123)


def shape(df):
    return df[df.education == 'a'].shape[0]

def len_df(df):
    return len(df[df['education'] == 'a'])

def query_count(df):
    return df.query('education == "a"').education.count()

def sum_mask(df):
    return (df.education == 'a').sum()

def sum_mask_numpy(df):
    return (df.education.values == 'a').sum()

def make_df(n):
    L = list(string.ascii_letters)
    df = pd.DataFrame(np.random.choice(L, size=n), columns=['education'])
    return df

perfplot.show(
    setup=make_df,
    kernels=[shape, len_df, query_count, sum_mask, sum_mask_numpy],
    n_range=[2**k for k in range(2, 25)],
    logx=True,
    logy=True,
    equality_check=False, 
    xlabel='len(df)')

[解決済み] Python Pandas 特定の値の出現回数を数える

質問

どのように解決するのですか？

関連

[解決済み] Pythonで現在時刻を取得する方法

[解決済み] 辞書のリストを辞書の値でソートするにはどうしたらいいですか？

[解決済み] リスト項目の出現回数を数えるにはどうしたらいいですか？

[解決済み] Python 3 の "python -m SimpleHTTPServer" に相当するものは何ですか？

[解決済み] Pandas DataFrameの行数を取得する方法は？

[解決済み] Pandas DataFrameの特定の列の値がNaNである行を削除する方法

[解決済み] PandasでDataFrameの行を列の値に基づいて削除する

[解決済み】文字列中のある文字の出現回数をカウントする

[解決済み】Pandas DataframeのカラムでNaN値をゼロに置き換えるには？

[解決済み] Django 1.7で初期マイグレーションからマイグレートバックする方法は？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み] Jupyterノートブックでenv変数を設定する方法

[解決済み] Pythonです。未束縛のメソッドを束縛する？

[解決済み] PythonからSMTPを使用してメールを送信する

[解決済み] Pythonで0xを使わずにhex()を使うには？

[解決済み] PyMongoで.sortを使用する

[解決済み] Pythonでマルチプロセッシングキューを使うには？

[解決済み] 異なる順序で同じ要素を持つ2つのJSONオブジェクトを等しく比較するには？

[解決済み] Pythonで、ウェブサイトが404か200かを確認するためにurllibをどのように使用しますか？

[解決済み] 新しいpip backtrackingの実行時問題の解決

[解決済み] 認証プラグイン 'caching_sha2_password' はサポートされていません。