[解決済み] Spark Dataframeの最初の1000行を取得する方法はありますか?
2023-02-02 06:36:47
質問
私は
randomSplit
関数を使用して、開発目的で使用するために少量のデータフレームを取得します。そして、結局、この関数によって返された最初の df を取得します。
val df_subset = data.randomSplit(Array(0.00000001, 0.01), seed = 12345)(0)
もし私が
df.take(1000)
を使用すると、データフレームではなく行の配列になってしまうので、うまくいきません。
dfの最初の1000行を取り、別のdfとして保存するためのより良い、より簡単な方法はありますか?
どのように解決するのですか?
お探しの方法は .limit .
最初のn行を取り出し、新しいDatasetを返します。headとの違いは、headが配列を返すのに対して、limitは新しいDatasetを返すことです。
使用例です。
df.limit(1000)
関連
-
[解決済み] Spark - CSVファイルをDataFrameとして読み込む?
-
[解決済み】SparkのDataFrame、Dataset、RDDの違いについて
-
[解決済み] Scalaの配列の初期化
-
[解決済み] リスト[Option]からNoneを除外するには?
-
[解決済み] Any、AnyVal、AnyRef、Objectの関係と、Javaコードでのマッピングについて教えてください。
-
[解決済み] sbtとGradleの比較 [終了しました]。
-
[解決済み] Scala の Case Classes のオーバーロード・コンストラクタ?
-
[解決済み] Apache SparkでDataframeのカラム値をListとして抽出する。
-
[解決済み] Scalaでマップを反転させるエレガントな方法
-
[解決済み] scala.concurrent.Promiseのユースケースは何ですか?
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
[解決済み] Scalaのパターンマッチはなぜ変数で機能しないのですか?
-
[解決済み] private[this] vs private
-
[解決済み] Any、AnyVal、AnyRef、Objectの関係と、Javaコードでのマッピングについて教えてください。
-
[解決済み] Scalaです。ScalaのコレクションにおけるTraversableとIterableの違いは何ですか?
-
[解決済み] Scalaでサブアレイを取得する正しい方法は何ですか?
-
[解決済み] scala で複数の case class をマッチングさせる
-
[解決済み] Scala の "new" キーワード
-
[解決済み] なぜ `private val` と `private final val` は違うのですか?
-
[解決済み] タイプダイナミックの仕組みと使い方を教えてください。
-
[解決済み] Scalaのtraitでvalとdefの使い分けは?