1. ホーム
  2. データベース
  3. ポストグレスキュー

Postgresqlのデータマージ、複数のデータを1つの操作にマージする。

2022-01-19 14:35:04

詳細テーブルの96のデータに対応するメインテーブルの単一のレコードでは、各データは15分間隔、詳細のない96のデータは、メインテーブルの日付trade_dateに対応し、各詳細は、フィールドstart_time、つまり、96の各データの詳細で最初のデータが00:00のstart_timeがあります。

第二は00:15、第三は00:30、など、23:45まで、今、あなたは24に詳細テーブルの96データをマージしたい、つまり、start_timeの最初のデータは00:00、第二は01:00、第三は02:00であります。

sql:select max(de.bid_num) report_num,concat(to_char(to_timestamp(concat(ru.trade_date,' ',de.start_time), 'YYYY-MM-DD HH24:mi') :: TIMESTAMP WITHOUT TIME ZONE, 'HH24 '), ':00') dd from quote_trade_rule ru LEFT JOIN quote_trade_rule_detail de on ru.trade_rule_id = de.trade_rule_ id
WHERE
  1 = 1
AND ru.market_id = 'a29c81ed-2baf-4c42-881a-f1e64a41e1b0'
AND to_char(ru.trade_date, 'YYYY-MM-DD') = '2018-10-17'
AND ru.rule_type = '2' GROUP BY dd ,trade_date ORDER BY dd,trade_date

マスターテーブルの10個のデータに対応する960個の明細を、次のように24個のデータ項目にまとめる。

追記:Postgresqlの実行計画に対するマージジョイン

マージジョイン

通常、ハッシュ結合はマージ結合よりもうまく機能しますが、ソースデータにインデックスがある場合、または結果がソートされている場合は、ソートされたマージ結合を実行する際にソートする必要はありません。

次の例では、peopleのidフィールドとdept01のdeptoフィールドの両方にインデックスが付けられ、インデックスからスキャンしたデータはすでにソートされているので、そのままMerge Joinに移行することができます。

highgo=# explain select people.id from people,dept01 where people.id=dept01.deptno;
                      QUERY PLAN
-------------------------------------------------------------------------------------------------
 Merge Join (cost=0.86..64873.59 rows=1048576 width=4)
  Merge Cond: (people.id = dept01.deptno)
  -> Index Only Scan using people_pkey on people (cost=0.44..303935.44 rows=10000000 width=4)
  -> Index Only Scan using idx_deptno on dept01 (cost=0.42..51764.54 rows=1048576 width=2)
(4 rows of records)

dept01のインデックスを削除すると、次の例に示すように、実行計画ではMerge Joinを経る前にまずdept01をソートしていることがわかります。

highgo=# explain select people.id from people,dept01 where people.id=dept01.deptno;
                      QUERY PLAN
-------------------------------------------------------------------------------------------------
 Merge Join (cost=136112.80..154464.29 rows=1048576 width=4)
  Merge Cond: (people.id = dept01.deptno)
  -> Index Only Scan using people_pkey on people (cost=0.44..303935.44 rows=10000000 width=4)
  -> Materialize (cost=136112.36..141355.24 rows=1048576 width=2)
     -> Sort (cost=136112.36..138733.80 rows=1048576 width=2)
        Sort Key: dept01.deptno
        -> Seq Scan on dept01 (cost=0.00..16918.76 rows=1048576 width=2)
(7 rows)

上記の実行計画では、"Sort Key: dept01.deptno" が見えますが、これはdept01テーブルのidフィールドをソートしているのです。

以上、個人的な体験談ですが、参考にしていただき、スクリプトハウスをもっと応援していただければと思います。もし、間違いや不十分な考察がありましたら、遠慮なくご指摘ください。