1. ホーム
  2. memory-management

[解決済み】Rのセッションで使用可能なメモリを管理するトリック

2022-03-23 20:56:14

質問

インタラクティブな R セッションで利用可能なメモリを管理するために、人々はどのようなトリックを使用しているのでしょうか? 私は以下の関数(2004年にPetr PikalとDavid Hindsがr-helpリストに投稿したものが元になっています)を使って、最大のオブジェクトをリストアップ(および/またはソート)し、時折 rm() そのうちのいくつかを紹介します。しかし、圧倒的に効果的だったのは......64bitのLinuxで、十分なメモリを搭載して実行することでした。

他に何かいい技があれば教えてください。 1つの投稿につき、1つお願いします。

# improved list of objects
.ls.objects <- function (pos = 1, pattern, order.by,
                        decreasing=FALSE, head=FALSE, n=5) {
    napply <- function(names, fn) sapply(names, function(x)
                                         fn(get(x, pos = pos)))
    names <- ls(pos = pos, pattern = pattern)
    obj.class <- napply(names, function(x) as.character(class(x))[1])
    obj.mode <- napply(names, mode)
    obj.type <- ifelse(is.na(obj.class), obj.mode, obj.class)
    obj.size <- napply(names, object.size)
    obj.dim <- t(napply(names, function(x)
                        as.numeric(dim(x))[1:2]))
    vec <- is.na(obj.dim)[, 1] & (obj.type != "function")
    obj.dim[vec, 1] <- napply(names, length)[vec]
    out <- data.frame(obj.type, obj.size, obj.dim)
    names(out) <- c("Type", "Size", "Rows", "Columns")
    if (!missing(order.by))
        out <- out[order(out[[order.by]], decreasing=decreasing), ]
    if (head)
        out <- head(out, n)
    out
}
# shorthand
lsos <- function(..., n=10) {
    .ls.objects(..., order.by="Size", decreasing=TRUE, head=TRUE, n=n)
}

解決方法は?

頻繁に再起動する一般的な戦略をさらに説明するために、次のようにします。 リトラー を使えば、簡単な式をコマンドラインから直接実行することができます。以下は、私が時々使っている例で、単純なクロスプロッドのために異なるBLASの時間を計っています。

 r -e'N<-3*10^3; M<-matrix(rnorm(N*N),ncol=N); print(system.time(crossprod(M)))'

同じく。

 r -lMatrix -e'example(spMatrix)'

Matrix パッケージをロードし(-packages | -l スイッチを使用)、spMatrix 関数の例を実行します。 r は常に'新鮮'にスタートするので、この方法はパッケージ開発中の良いテストにもなります。

最後になりましたが、r は '#!/usr/bin/r' shebang-header を使用したスクリプトの自動バッチモードでも素晴らしい働きをします。 Rscript は littler が利用できない場合 (例: Windows) の代替となります。