[解決済み] [Solved] data.frameで全てまたは一部のNA(欠損値)を含む行を削除する。
2022-03-23 13:38:50
質問
このデータフレームから、以下のような行を削除したい。
a)
含む
NA
を全列に渡って表示する。
以下は、私のデータフレームの例です。
gene hsap mmul mmus rnor cfam
1 ENSG00000208234 0 NA NA NA NA
2 ENSG00000199674 0 2 2 2 2
3 ENSG00000221622 0 NA NA NA NA
4 ENSG00000207604 0 NA NA 1 2
5 ENSG00000207431 0 NA NA NA NA
6 ENSG00000221312 0 1 2 3 2
基本的には、以下のようなデータフレームを取得したいです。
gene hsap mmul mmus rnor cfam
2 ENSG00000199674 0 2 2 2 2
6 ENSG00000221312 0 1 2 3 2
b)
含む
NA
一部のカラムにのみ
で、このような結果も得られます。
gene hsap mmul mmus rnor cfam
2 ENSG00000199674 0 2 2 2 2
4 ENSG00000207604 0 NA NA 1 2
6 ENSG00000221312 0 1 2 3 2
解決方法は?
こちらもご覧ください
complete.cases
:
> final[complete.cases(final), ]
gene hsap mmul mmus rnor cfam
2 ENSG00000199674 0 2 2 2 2
6 ENSG00000221312 0 1 2 3 2
na.omit
をすべて削除するには、より良い方法です。
NA
's.
complete.cases
は、データフレームの特定の列のみを含むことで、部分的な選択を可能にします。
> final[complete.cases(final[ , 5:6]),]
gene hsap mmul mmus rnor cfam
2 ENSG00000199674 0 2 2 2 2
4 ENSG00000207604 0 NA NA 1 2
6 ENSG00000221312 0 1 2 3 2
あなたの解決策はうまくいくはずがありません。もしあなたが
is.na
というようなことをしなければならない。
> final[rowSums(is.na(final[ , 5:6])) == 0, ]
gene hsap mmul mmus rnor cfam
2 ENSG00000199674 0 2 2 2 2
4 ENSG00000207604 0 NA NA 1 2
6 ENSG00000221312 0 1 2 3 2
を使用していますが
complete.cases
の方がはるかにわかりやすいし、スピードも速い。
関連
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み] 既存のDataFrameに新しい列を追加する方法は?
-
[解決済み] データフレーム列の名前によるドロップ
-
[解決済み] R dataframeでNAの値をゼロに置き換えるには?
-
[解決済み] 空のPandas DataFrameを作成し、それを埋める?
-
[解決済み] pandas GroupByを使ってグループごとの統計情報(カウント、平均値など)を取得する?
-
[解決済み] 空のdata.frameを作成する
-
[解決済み】サブセットされたデータフレーム内の未使用の因子レベルを削除する
-
[解決済み】変数をグループ別に合計する方法
-
[解決済み】data.frameのカラムを因子から文字に変換する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】基本 - T-検定 -> グループ化因子は正確に2水準でなければならない
-
[解決済み] 不適合な配列のコードエラー
-
[解決済み】model.frame.defaultでのエラー:変数の長さが異なる
-
[解決済み】Rで立方根と対数変換をする
-
[解決済み】Rエラー。"新しい列は既存の列の後に穴を空ける"
-
[解決済み】ggplotのエラー。関数型オブジェクトのスケールを自動的に選択する方法がわかりません。
-
[解決済み】二項演算子への非数値引数【非公開
-
[解決済み】ggplot2でのプロット:「Error: カテゴリ軸のY軸に "Discrete value supplied to continuous scale "と表示される。
-
[解決済み] na.fail.defaultのエラー:オブジェクトの値が見つからない - しかし、値が見つからないことはありません。
-
[解決済み】dplyr: "Error in n(): 関数は直接呼ばれるべきではありません"