[解決済み] kmeans Quick-TRANSferのステージステップが最大値を超えた
質問内容
636,688行、7列のデータセットに対して、Rでk-meansクラスタリングを実行する場合、標準の
stats
パッケージを使用します。
kmeans(dataset, centers = 100, nstart = 25, iter.max = 20)
.
次のようなエラーが発生します。
Quick-TRANSfer stage steps exceeded maximum (= 31834400)
でコードを見ることができますが
http://svn.r-project.org/R/trunk/src/library/stats/R/kmeans.R
- 何が問題なのか、よくわかりません。私の問題は、私のデータセットのサイズに関係していると思いますが、この問題を軽減するために何ができるのか、誰かが一度明らかにしてくれるとありがたいのですが。
解決方法は?
私もちょうど同じ問題を抱えていました。
R の kmeans のドキュメントを参照してください。
?kmeans
:
ハーティガン-ウォン・アルゴリズム は、一般にこれらのいずれよりも良い仕事をしますが、試してみてください。 複数のランダムスタート('nstart'> 1)を推奨することが多いです。 まれに いくつかの点(xの行)が極端に近い場合。 アルゴリズムは "Quick-Transfer "ステージで収束しないかもしれません。 , は警告を発し、'ifault = 4'を返します。 わずかな その場合、データの丸めが推奨されるかもしれません。
このような場合、LloydアルゴリズムやMacQueenアルゴリズムに変更する必要があるかもしれません。
ここでRの厄介なところは、気づかないうちに警告が続いていることです。私のベンチマーク目的では、これを失敗した実行とみなし、したがって、私は使用します。
if (kms$ifault==4) { stop("Failed in Quick-Transfer"); }
ユースケースによっては、次のようにすることもできます。
if (kms$ifault==4) { kms = kmeans(X, kms$centers, algorithm="MacQueen"); }
でなく、別のアルゴリズムで継続する。
K-meansのベンチマークを行う場合、Rでは
iter.max=10
をデフォルトで使用します。収束するのに10回以上かかる場合があります。
関連
-
[解決済み】R:関数に有限な'ylim'値が必要
-
[解決済み】R: 複数行の ggplot2 コマンドで「単項演算子エラー」が発生する。
-
[解決済み] 変数の型(リスト)が無効です
-
[解決済み】Rで「パッケージ'FILE_PATH'のインストールで終了ステータスが0でなかった」。
-
[解決済み】Rでの関数の最適化(L-BFGS-Bでは'fn'に有限の値が必要)。
-
[解決済み] テスト
-
[解決済み] na.fail.defaultのエラー:オブジェクトの値が見つからない - しかし、値が見つからないことはありません。
-
[解決済み】randomForestの実行予測で「NA/NaN/Inf in foreign function call (arg 7)」をなくすには?
-
[解決済み】R4DSのエラー比較(1)は、アトミック型とリスト型でのみ可能です
-
[解決済み】forループを実行すると「要因のレベルセットが異なる」というエラーが発生する
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み】knitrのドキュメントでinstall.packagesが失敗する。"ミラーを設定せずにCRANを使おうとしている"
-
[解決済み】エラー。Rの次元数が正しくない
-
[解決済み】ベースグラフィックスでプロットエリアの外側に凡例をプロットする?
-
[解決済み】LMEモデルのレベル0、ブロック1でのバックソルブにおける特異性
-
[解決済み] write.tableしようとすると、未実装の型リストが表示される。
-
[解決済み】「Error in stripchart.default(x1, ...) : invalid plotting method」エラーを回避する方法は?
-
[解決済み] 因子を日付形式に変換するにはどうすればいいですか?
-
[解決済み】 eval(expr, envir, enclos) でのエラー : オブジェクトが見つかりません。
-
[解決済み】forループを実行すると「要因のレベルセットが異なる」というエラーが発生する
-
[解決済み] Rプロセスで使用可能なメモリを増やす(または減らす)。