1. ホーム
  2. image

[解決済み] 近接型重複画像検出システム【終了しました

2023-02-16 21:40:09

質問

与えられた画像のセットをお互いの類似性でソートする高速な方法は何でしょう。

今のところ、2つの画像の間でヒストグラム分析を行うシステムがありますが、これは非常に高価な操作であり、やりすぎのように思えます。

理想的には、私は各画像にスコア (たとえば、RGB 平均のような整数スコア) を与え、そのスコアでソートできるようなアルゴリズムを探しています。同一のスコアまたは互いに隣接するスコアは、重複している可能性があります。

0299393
0599483
0499994 <- possible dupe
0499999 <- possible dupe
1002039
4995994
6004994 

画像ごとのRGB平均が最悪なんですが、似たようなものってありますか?

どのように解決するのですか?

画像検索や類似度測定の研究は多く行われていますが 簡単な問題ではありません。一般に、1つの int だけでは、画像が非常に類似しているかどうかを判断することはできません。高い偽陽性率が発生します。

しかし、多くの研究がなされているので、そのいくつかを見てみるとよいでしょう。たとえば この論文 (PDF) は、多くのデータを保存することなく、重複する画像をすばやく見つけるのに適したコンパクトな画像フィンガープリント・アルゴリズムを提供しています。これはどうやら アプローチであると思われます。

よりシンプルで、よりアドホックなものを探している場合。 このSO質問 には、いくつかの適切なアイデアがあります。