1. ホーム
  2. sql

[解決済み] SQL/Hive count distinct カラム

2022-02-15 10:42:19

質問

Hiveでこれを行うにはどうすればよいですか?

    columnA       columnB    columnC
     100.10      50.60       30
     100.10      50.60       30
     100.10      50.60       20
     100.10      70.80       40

出力する必要があります。

  columnA   columnB    No_of_distinct_colC
  100.10    50.60       2
  100.10    70.80       1

正しいと思われるクエリ

SELECT columnA,columnB,COUNT(distinct column C)
from table_name
group by columnA,columnB

これで良いのでしょうか?SQLも大丈夫です。

UPDATE: columnCの標準偏差を求めるにはどうすればよいですか?これはすぐに必要です。

どのように解決するのですか?

はい、ほぼ正解です。しかし、1つだけ簡単な間違いがあります。COUNTの中のカラム名が間違っているのです。

SELECT columnA,columnB,COUNT(DISTINCT columnC) No_of_distinct_colC
from table_name
group by columnA,columnB