[解決済み] data.frameとmatrixのどちらを使うべきですか?
2022-04-25 10:10:25
質問
を使用する必要があります。
data.frame
を使用した方が良い場合、また
matrix
?
どちらもデータを長方形で管理しているので、時々不明な点があります。
どのような場合にどちらのデータ型を使うか、一般的な法則はありますか?
どのように解決するのですか?
質問の中に答えの一部がすでに含まれています。列(変数)が異なるタイプ(数値/文字/論理など)であることが予想される場合、データフレームを使用します。行列は、同じ型のデータのためのものです。
したがって、matrix/data.frameの選択は、同じ型のデータを持っている場合にのみ問題となります。
答えは、data.frame/matrixのデータを使って何をするかによります。もし、他の関数に渡すのであれば、その関数の引数の型によって、選択が決まります。
また
行列の方がメモリ効率が良い。
m = matrix(1:4, 2, 2)
d = as.data.frame(m)
object.size(m)
# 216 bytes
object.size(d)
# 792 bytes
行列は、線形代数的な演算を行う場合には必要不可欠なものです。
データフレームは、列の名前を頻繁に参照する場合に便利です(コンパクトな$演算子で)。
また、データフレームは、各列に個別に書式を適用できるため、表形式の情報を報告(印刷)する場合にも適していると思います。
関連
-
[解決済み] Rを再起動せずにパッケージをアンロードする方法
-
[解決済み] data.frameの行を論理的な条件によってフィルタリングする
-
[解決済み] Rの再現性のある優れた例題の作り方
-
[解決済み] リストやデータフレームの要素にアクセスするためのブラケット[ ]とダブルブラケット[[ ]]の違いについて
-
[解決済み] 空のdata.frameを作成する
-
[解決済み] なぜ `[`] は `subset` よりも優れているのですか?
-
[解決済み] numpyの配列と行列の違いは何ですか?どちらを使うべきですか?
-
[解決済み】pandasでカラムの種類を変更する
-
[解決済み] [Solved] data.frameで全てまたは一部のNA(欠損値)を含む行を削除する。
-
[解決済み】data.table vs dplyr:一方がうまくできない、またはうまくできないことを行うことができますか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン