[解決済み] pysparkを使用してプロットする方法は?
2022-02-10 10:04:01
質問
2つの独立した列をプロットする必要があります:最初の列はデータを表し、2番目の列は時間を表します。
All_packets= df.select("ip_adr_src","asn_val","timestamp")
EB_packets=All_packets.filter("asn_val is not NULL")
EB_packets.show()
plotdf=EB_packets.select("asn_val","timestamp")
プロットしたい
ans_val
によるグループ
ip_adr_src per time
.
もし、6つの
ip_adr_src
ということは、カーブも6本あるはず。
+--------------------+---------------------------------+-------------+
| ip_adr_src |asn_val | timestamp|
+--------------------+---------------------------------+-------------+
|14:15:92:cc:00:01...| 707|1539071748441|
|14:15:92:cc:00:02...| 1212|1539071752314|
|14:15:92:cc:00:00...| 1616|1539071755578|
|14:15:92:cc:00:04...| 1818|1539071757167|
|14:15:92:cc:00:03...| 2020|1539071759297|
|14:15:92:cc:00:00...| 2121|1539071760408|
|14:15:92:cc:00:09...| 2323|1539071764035|
|14:15:92:cc:00:07...| 2424|1539071765775|
|14:15:92:cc:00:00...| 2525|1539071768560|
|14:15:92:cc:00:06...| 5858|1539071845370|
|14:15:92:cc:00:00...| 6060|1539071850129|
|14:15:92:cc:00:05...| 6262|1539071855046|
|14:15:92:cc:00:00...| 6969|1539071872523|
|14:15:92:cc:00:07...| 6969|1539071872528|
|14:15:92:cc:00:08...| 7171|1539071877609|
しかし、私のテストはすべて間違っていて、このようなエラーが発生します。
Dataframe doesn't have an object `'plot'`
ご教授いただければ幸いです。
どのように解決するのですか?
どの列をプロットしたいのかがよくわからないのですが、プロットする方法について助けが必要なのではないでしょうか?これは、私が
ans_val
列に対して
timestamp
を1つ作成します。
import matplotlib.pyplot as plt
y_ans_val = [val.ans_val for val in df.select('ans_val').collect()]
x_ts = [val.timestamp for val in df.select('timestamp').collect()]
plt.plot(x_ts, y_ans_val)
plt.ylabel('ans_val')
plt.xlabel('timestamp')
plt.title('ASN values for time')
plt.legend(['asn_val'], loc='upper left')
plt.show()
他のカラムをプロットする必要がある場合は
plt.plot(x,y)
コマンドを複数回実行し、それぞれの名前を
plt.legend(your_cols, loc='upper left')
関数を使用します。
関連
-
Pythonコードの可読性を向上させるツール「pycodestyle」の使い方を詳しく解説します
-
[解決済み] TypeError: 'DataFrame' オブジェクトは呼び出し可能ではない
-
[解決済み] プログラムの実行やシステムコマンドの呼び出しはどのように行うのですか?
-
[解決済み] リストのリストからフラットなリストを作るには?
-
[解決済み] 関数内でグローバル変数を使用する
-
[解決済み] PandasでDataFrameの行を反復処理する方法
-
[解決済み] 列の値に基づいてDataFrameから行を選択するにはどうすればよいですか?
-
[解決済み】ネストされたディレクトリを安全に作成するには?
-
[解決済み】forループを使った辞書の反復処理
-
[解決済み】2つの辞書を1つの式でマージする(辞書の和をとる)には?)
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
ピロウズ画像色処理の具体的な活用方法
-
Python関数の高度な応用を解説
-
PicgoのイメージベッドツールをPythonで実装する
-
Pythonの画像ファイル処理用ライブラリ「Pillow」(グラフィックの詳細)
-
[解決済み】「SyntaxError.Syntax」は何ですか?Missing parentheses in call to 'print'」はPythonでどういう意味ですか?
-
[解決済み] 'DataFrame' オブジェクトに 'sort' 属性がない
-
[解決済み】Python elifの構文が無効です【終了しました
-
[解決済み】Python: SyntaxError: キーワードは式になり得ない
-
[解決済み】ValueError: pickleプロトコルがサポートされていません。3、python2 pickleはpython3 pickleでダンプしたファイルを読み込むことができない?
-
[解決済み】「OverflowError: Python int too large to convert to C long" on windows but not mac