2つのデータフレームが等しいかどうかを確認する方法 [重複]について
2023-09-14 17:42:25
質問
Rで大きなデータセットを持っていて、そのうちの2つが同じかどうかを知りたいだけだとします。同じ結果を得るために異なるアルゴリズムを試しているときによく使います。例えば、以下のようなデータセットがあるとします。
df1 <- data.frame(num = 1:5, let = letters[1:5])
df2 <- df1
df3 <- data.frame(num = c(1:5, NA), let = letters[1:6])
df4 <- df3
というわけで、比較するためにこんなことをしています。
table(x == y, useNA = 'ifany')
これは、データセットにNAがない場合にうまく機能します。
> table(df1 == df2, useNA = 'ifany')
TRUE
10
でも、NAがあるとそうでもない。
> table(df3 == df4, useNA = 'ifany')
TRUE <NA>
11 1
例では、簡単に解除できる
NA
を問題ないと判断するのは簡単です。
は
が等しいことが分かっているので問題ありません。問題なのは
NA == <anything>
がもたらす
NA
を返すので,どちらかのデータセットが
NA
があると、もう一方のデータセットがその同じ位置に何を持つかは関係なく、結果は常に
NA
.
そのため
table()
を使ってデータセットを比較することは、私には理想的とは思えません。
2つのデータフレームが同一であるかどうかを確認するにはどうすればよいですか?
追伸: これは以下のものと重複していないことに注意してください。 R - 複数のデータセットを比較する , Rで2つのデータセットを比較する または Rでデータセットを比較する
どのように解決するのですか?
all.equalで検索してみてください。ライダーもいますが、うまくいくかもしれません。
all.equal(df3,df4)
# [1] TRUE
all.equal(df2,df1)
# [1] TRUE
関連
-
[解決済み] データフレームを結合(マージ)する方法(内側、外側、左側、右側)
-
[解決済み] マスター・マスターとマスター・スレーブ、どちらのデータベース・アーキテクチャが良いのか?
-
[解決済み] リレーショナル・データベースにおけるカタログとスキーマの違いは何ですか?
-
[解決済み] Postgresql - データベースをバックアップし、異なる所有者にリストア?
-
[解決済み] 非リレーショナルデータベース設計【終了しました
-
[解決済み] キーの取り外し方法を教えてください。
-
[解決済み] 73億行のマーケットデータ(読み出しに最適化)を格納する方法とは?
-
[解決済み] 破損したSQLite3データベースを復旧する方法
-
[解決済み] RedisデータベースのHSETとHMSETの違いは何ですか?
-
強いエンティティ型と弱いエンティティ型の例
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] 外部キーを主キーにするのは問題ないですか?
-
[解決済み] マスター・マスターとマスター・スレーブ、どちらのデータベース・アーキテクチャが良いのか?
-
[解決済み] データベースに郵便番号を格納する必要があります。カラムの大きさはどのくらいにすればよいでしょうか?
-
[解決済み] Neo4jでデータベースを削除/作成する方法は?
-
[解決済み] データベースからdjangoのモデルを生成することは可能か?
-
[解決済み] ファセット検索とは何ですか?
-
[解決済み] なぜデータベースは常に円柱で表現されるのですか?[クローズド]
-
[解決済み] 私はCouchDBでトランザクションとロックを行うことができますか?
-
[解決済み] PostgreSQLの隠し味【終了しました
-
Oracleの数値のデフォルトの精度とスケールは何ですか?