1. ホーム
  2. sql-server

[解決済み] [Solved] T-SQLのselectで各行に乱数を生成する方法は?

2022-04-14 13:35:43

質問

テーブルの各行で異なる乱数が必要です。 以下の一見わかりやすいコードでは、各行に同じ乱数値を使用しています。

SELECT table_name, RAND() magic_number 
FROM information_schema.tables 

INTかFLOATで出したいんだけど。 後は、この乱数を使って、既知の日付からオフセットしたランダムな日付、例えば開始日から1~14日オフセットした日付を作成しようと思っています。

これは、Microsoft SQL Server 2000の場合です。

解決方法は?

をご覧ください。 SQL Server - セットベースの乱数 には非常に詳しい説明があります。

要約すると、次のコードは0から13の間の乱数を一様分布で生成します。

ABS(CHECKSUM(NewId())) % 14

範囲を変更するには、式の末尾の数字を変更するだけです。正の数と負の数の両方を含む範囲が必要な場合は、特に注意してください。間違えると、0という数字が二重にカウントされてしまう可能性があります。

このコードには、ごくわずかなバイアスがかかっています。 CHECKSUM() の結果は、sql Intデータ型の全範囲にわたって均一な数値、あるいは少なくとも私(編集者)のテストが示す限り、それに近い数値になります。しかし、CHECKSUM()がその範囲の最上位にある数値を生成した場合、いくらかの偏りが生じます。最大整数の前に、可能な最大整数と希望する範囲のサイズ(この場合は14)の最後の倍数との間の数値を得るときはいつでも、その結果は、14の最後の倍数から生成できない範囲の残りの部分よりも優先されます。

例えば、Int型の全範囲が19しかないとします。19は保持できる最大の整数です。CHECKSUM()の結果が14-19となったとき、これらは0-5の結果に対応します。これらの数値は次のようになります。 ずっしり CHECKSUM()が6-13を生成する確率は2倍なので、6-13よりも好まれるのです。これを視覚的に説明するのは簡単です。以下は、虚数の整数範囲について、考えられるすべての結果を示しています。

チェックサム 整数 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
レンジ結果: 0 1 2 3 4 5 6 7 8 9 10 11 12 13 0 1 2 3 4 5

このように、ある数字が他の数字より多く出る可能性があることがわかります。つまり、偏りがあるのです。ありがたいことに、Int 型の実際のレンジは 大いに そのため、ほとんどの場合、偏りはほとんど検出できません。しかし、もしあなたが重大なセキュリティコードでこの処理を行うことになったら、注意しなければならないことがあります。