[解決済み] 選択された列のみのデータフレームで一意に決まる
2023-03-21 07:44:40
質問
100列のデータフレームがあり、そのうちの2列だけを比較してユニークな行を見つけたいのです。これは簡単なことだと期待しているのですが、私はそれを動作させることができません。
unique
とか
duplicated
のように、自分自身を表現することができます。
以下のように、私は
id
と
id2
:
data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z"))
id id2 somevalue
1 1 x
1 1 y
3 4 z
どちらかを取得したいと思います。
id id2 somevalue
1 1 x
3 4 z
または
id id2 somevalue
1 1 y
3 4 z
(ユニークな行のうち、どちらを残すかにはこだわりがありません)
どのように解決するのですか?
OK、重複しない列のどの値を選択しても問題ないなら、これはかなり簡単なはずです。
dat <- data.frame(id=c(1,1,3),id2=c(1,1,4),somevalue=c("x","y","z"))
> dat[!duplicated(dat[,c('id','id2')]),]
id id2 somevalue
1 1 1 x
3 3 4 z
の中は
duplicated
の呼び出しの中で、私は単に
dat
から、重複して欲しくないカラムだけを渡しているだけです。このコードでは、常に自動的に
が最初に
を自動的に選択します。(この場合、x)。
関連
-
R - よくあるエラーとその原因 - 注意事項
-
[解決済み] 重複した行を削除する
-
[解決済み] JavaScriptの配列で一意な値をすべて取得する(重複を排除する)。
-
[解決済み] データフレームの行を複数の列でソート(並び替え)する。
-
[解決済み] データフレーム列の名前によるドロップ
-
[解決済み] R dataframeでNAの値をゼロに置き換えるには?
-
[解決済み] Rでロードされているパッケージのバージョンを調べるには?
-
[解決済み] なぜ `[`] は `subset` よりも優れているのですか?
-
[解決済み] ベクトル中のある要素のインデックスを求めるR関数はありますか?
-
[解決済み】私のggplot2構文が賢明であるときに、R CMDチェック「no visible binding for global variable」注記を処理するにはどうすればよいですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
R - よくあるエラーとその原因 - 注意事項
-
データボックス内の行/列の削除/追加を行うR言語
-
[解決済み] Rの二乗偏差の総和の算出
-
[解決済み] lm.fit(x,y,offset = offset, singular.ok,...) 0 非NAケースでboxcox式で計算するとエラーになる。
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] 不足しているパッケージをチェックし、インストールするためのエレガントな方法?
-
[解決済み】安定したマッピングを持つggplot2のカテゴリ変数に色を割り当てるには?
-
[解決済み】ifelse()でDateオブジェクトがnumericオブジェクトにならないようにする方法
-
[解決済み] FUN内のlapplyインデックス名へのアクセス
-
[解決済み] data.table内の重複・非一意な行のフィルタリング