[解決済み] ある値の頻度を表すパンダシリーズがある場合、その頻度をパーセントに変換するにはどうすればよいですか?
2023-03-20 21:41:12
質問
kaggle.comのタイタニック号のデータセット(タイタニック号に乗ったすべての人のデータ)を使って実験していたところ、このような性別の内訳を思いつきました。
df = pd.DataFrame({'sex': ['male'] * 577 + ['female'] * 314})
gender = df.sex.value_counts()
gender
male 577
female 314
タイタニック号での各性別の割合を調べたいのですが。
私のやり方は少し理想的ではありません。
from __future__ import division
pcts = gender / gender.sum()
pcts
male 0.647587
female 0.352413
もっと良い(慣用的な)方法はないのでしょうか?
どのように解決するのですか?
この関数はpandasに実装されており、実はvalue_counts()の中にも実装されています。計算する必要はありません :)
を入力するだけです。
df.sex.value_counts(normalize=True)
で、まさに希望通りの出力が得られます。
value_counts()はNA値を除外するため、数値の合計が1にならない可能性があることに注意してください。 ここを参照してください。 http://pandas-docs.github.io/pandas-docs-travis/generated/pandas.Series.value_counts.html (DataFrameのカラムはSeriesです)
関連
-
[解決済み] Pandas DataFrameの特定の列の値がNaNである行を削除する方法
-
[解決済み] すべての例外をキャッチする `try`/`except` ブロックはどのように書けばよいですか?
-
[解決済み] 指定されたディレクトリ内のファイルを反復処理するにはどうすればよいですか?
-
[解決済み] pandasのデータフレームのインデックスをカラムに変換する方法
-
[解決済み] try/exceptを使わずに、文字列がintを表すかどうかを確認するにはどうしたらよいですか?
-
[解決済み] Pandas DataFrameの値がNaNであるかどうかを確認する方法
-
[解決済み] 指定した列の最初の行の値を取得する
-
[解決済み] pandasで2つの系列をDataFrameに結合する
-
[解決済み] Pandasのデータフレームでタプルの列を分割するにはどうしたらいいですか?
-
[解決済み] PythonでSVGからPNGに変換する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] Pythonのマルチプロセッシングプールimap_unorderedの呼び出しの進捗を表示しますか?
-
[解決済み] Python 2.7サポート終了?
-
[解決済み] Pythonのargparseを使った隠し引数の作成
-
[解決済み] ファブリック経由でデプロイユーザとしてvirtualenvを有効化する
-
[解決済み] スペースがないテキストを単語のリストに分割する方法
-
[解決済み] SQLAlchemy - テーブルのリストを取得する
-
[解決済み] Jupyter (IPython)ノートブックのセッションをpickleして保存する方法
-
[解決済み] tensorflowのCPUのみのインストールでダイナミックライブラリ 'cudart64_101.dll' を読み込めなかった
-
[解決済み] PythonのRequestsモジュールを使ってWebサイトに "ログイン "するには?
-
[解決済み] Pythonでリストが空かどうかをチェックする方法は?重複