[解決済み] Python Pandas read_csv は行をスキップしてヘッダを保持します。
2023-04-01 03:33:19
質問
csvファイルのn行目をスキップして、1行目であるヘッダを残す方法がわからなくて困っています。
私がしたいことは、反復処理ですが、最初の行からヘッダーを維持することです。
skiprows
は、ヘッダーをスキップされた行の後の最初の行にします。 これを行う最良の方法は何でしょうか?
data = pd.read_csv('test.csv', sep='|', header=0, skiprows=10, nrows=10)
どのように解決するのですか?
行番号のリストを
skiprows
には、整数の代わりに行番号のリストを渡すことができます。
関数に整数の10を与えることで、最初の10行をスキップしているだけです。
最初の0行目(ヘッダーとして)を残し、10行目までをスキップするには、次のように書きます。
pd.read_csv('test.csv', sep='|', skiprows=range(1, 10))
を使って行をスキップする他の方法
read_csv
どの行をスキップするかを制御する主な方法は、次の2つです。
read_csv
が使用するのは
header
または
skiprows
パラメータを使用します。
次のような1列のCSVファイルがあったとします。
a
b
c
d
e
f
以下の各例では、このファイルは
f = io.StringIO("\n".join("abcdef"))
.
-
すべての行を値として読み込む (ヘッダなし、デフォルトは整数)
>>> pd.read_csv(f, header=None) 0 0 a 1 b 2 c 3 d 4 e 5 f
-
特定の行をヘッダーとして使用します(それ以前の行はすべてスキップします)。
>>> pd.read_csv(f, header=3) d 0 e 1 f
-
MultiIndexを作成するヘッダとして複数行を使用する(最後に指定したヘッダ行より前の行を全てスキップする)。
>>> pd.read_csv(f, header=[2, 4]) c e 0 f
-
ファイルの先頭からN行をスキップします(スキップされない最初の行はヘッダです)。
>>> pd.read_csv(f, skiprows=3) d 0 e 1 f
-
行のインデックスを与えて1つ以上の行をスキップします(スキップされない最初の行はヘッダです)。
>>> pd.read_csv(f, skiprows=[2, 4]) a 0 b 1 d 2 f
関連
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 既存のDataFrameに新しい列を追加する方法は?
-
[解決済み] Pandas DataFrameの特定の列の値がNaNである行を削除する方法
-
[解決済み] pandasを使った "大量データ "ワークフロー【終了しました
-
[解決済み] Pandasのデータフレームから行を選択するために値のリストを使用する
-
[解決済み] Python Pandas データをトークン化するエラー
-
[解決済み] 重複するインデックスを持つpandasの行を削除する
-
[解決済み】pandasのDataFrameにヘッダー行を追加する方法
-
[解決済み] Pythonです。未束縛のメソッドを束縛する?
-
[解決済み] Pythonの文字列書式をリストで使う
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] PythonでのAWS Lambdaのインポートモジュールエラー
-
[解決済み] Jupyterノートブックでenv変数を設定する方法
-
[解決済み] Python 3でバイナリデータを標準出力に書き込むには?
-
[解決済み] データフレームをソートした後にインデックスを更新する
-
[解決済み] Django Rest Framework ファイルアップロード
-
[解決済み] Jupyter (IPython)ノートブックのセッションをpickleして保存する方法
-
[解決済み] subprocess.run()の出力を抑制またはキャプチャするには?
-
[解決済み] matplotlib でプロットの軸、目盛、ラベルの色を変更する方法
-
[解決済み] Flaskで非同期タスクを作る
-
[解決済み] Pythonの文字列の前にあるbという接頭辞は何を意味するのですか?