1. ホーム
  2. hadoop

[解決済み] HADOOPでワード数を値でソートする方法は?[重複している]。

2022-02-12 07:53:31

質問

<余談
この質問には、すでにここで回答があります :
閉店 8年前 .

私は、Hadoopがキーでソートできることを知っていますが、値でソートできません。

値をソートするには、パーティショナー、グルーピングコンパレーター、ソートコンパレーターが必要なことは知っています。

しかし、私は値によって単語数を並べ替えるために、これらの概念を一緒に適用することに少し混乱しています。

あるいは、コンバイナーで出現回数をカウントし、ソートしてreducerに送る必要があるのでしょうか?

単語数の例を値でソートする方法を教えてください。

どのように解決するのですか?

2つ目のMapreduceジョブが必要です。合計数で結論づけるのでなければ(最初のMRジョブがそうする)、値(単語の数)でソートすることをどう考えればいいのでしょうか?論理的に不可能です。