1. ホーム
  2. Deep Learning

深層学習トラッキングアルゴリズム概要

2022-02-13 08:02:28
<パス

論文を読み始めて半月が過ぎたところなので、今後の検討とまとめのために感想を書いておきます。

2018.07.27
TLDはディープラーニングを用いない従来のアルゴリズムです。
DLTはターゲット追跡の分野で初めて深層学習の適用に成功したアルゴリズムであり、SO-DLTはその改良版である。
SO-DLTもFCNTも純粋にディープでエンドツーエンドのトラッキングで、FCNTは異なる層の特徴を用いてトラッキングのための異なるレベルの情報を取得していますが、ずいぶん前の話ですね。
HCFは深度特徴+従来のアルゴリズム(パーティクルフィルタリング)で、深度特徴の部分は3層の特徴を使って深度特徴を抽出するものです
MDNetは純粋な深度アルゴリズムで、それ自体で単純なCNNを構築するが、速度が遅い。
SO-DLT、MDNetともに事前学習+SGDによるオンラインファインチューニング

従来のトラッキングアルゴリズム(相関フィルタ)は、高速でリアルタイムに実行することが容易ですが、ディープアルゴリズムほど堅牢ではありません。

-------------------------------------------------------------------- split line ----------------------------------------------------------- -----------------

2018.08.03
最近読んだ本と、先輩との意見交換で学んだことを一言ずつ〜。
従来アルゴリズム MOSSEフレームレート669fps、KCFフレームレート292fps(論文EAST, ICCV2017 spotlightより)
SANetは、MDNetの改善、高精度に基づくが、速度は1fpsのみであり、アルゴリズムのリアルタイム要件を満たすことができない基本的に考慮しない、実用的ではない。
VITAL (CVPR2018): GANを用いて正のサンプルの数を拡大し、さらに高次の敏感な損失関数を用いて単純な負のサンプルが分類器学習に与える影響を軽減し、CREST (ICCV2017, spotlight) をベースに改良したバージョンです。
深度アルゴリズムのGOTURNは165fpsと高速、精度は未確認でわかりません〜〜。
ROLO(2016年ArXiv)。YOLO+LSTM

双子のネットワークSiamFC (ECCV2016、テンプレートマッチングベース、オンライン微調整なし、86fps)が非常に便利で、SiamFCをベースにした改良版がここ2年非常にホットで、良い方向性を感じます、改良版には以下のような主記事があります。
CFNet(CVPR2017):SiamFCと同じ作者ですが、CFNetはエンドツーエンドを実現するために層を構築するニューラルネットワークのフィルタリングの理論に関連してきます(数学的スキルはかなり高い)、神を崇めよ
RFL(ICCV2017):LSTMを使用、アイデアはあるが精度があまり上がらない。
EAST (ICCV2017): 今見ているところ、次回更新予定です。
PTAV(ICCV2017)です。(名案) 速度と精度のバランス。トラッキングプロセスを2つの並行だが協調的なスレッドに分解する:1つは高速トラッキングのため、もう1つは正確な検証のため

CVPR2018では、SiamFCの改良版である4つの論文が掲載されています。
SINT++ (CVPR2018): SiamFCの利用に加え、正サンプルの数を拡張するPSGN (正サンプル生成ネットワーク) と、より難易度の高い正サンプルを生成するHPTN (ハード正変換ネットワーク) が提案されています。
サイアムRPN SiamFC + RPNネットワーク、分類と回帰の2つのブランチを出力(SiamFCでは回帰なし、マルチスケールテスト)、フレームレート160fps(オンライン微調整なし)、エンドツーエンド、シングルターゲット・トラッキング
RASNet:特徴量学習と判別学習を分離(オリジナルのSiamFCは、テスト時に ϕ ( . ) \Ȃ <スパン <スパン ϕ ( <スパン . ) 関数で両者を同時に学習させるとオーバーフィットになりやすく、CFNetでは円形行列を追加したにもかかわらず境界効果が導入されると著者らは述べている)。 テンプレートブランチ(検出ブランチは変更なし)において まず、一般注意で全訓練サンプルの普遍的特徴を学習し、残留注意枝で現在のフレームと普遍的特徴の差を学習し、その和を現在のフレームの特徴とする。また、チャネルアテンションブランチは、特徴の重み付けに使用される。
SA-サイアム
この前の2つはまだ読んでないので、読んだら更新します~~。

----------------------------------------------------------------- split line -------------------------------------------------------------- ------------------------

今日、もっと良いまとめを見たので、ここに記録しておきます〜。

<テーブル トラッカー AUC 精度 OS (%) DP (%) CLE (ピクセル) FPS ディープラーニング MDNet 0.70767 0.94803 - - - - Y C-COT 0.6725 0.89912 - - - - N シントプラス 0.65517 0.88157 - - - - Y SRDCFdecon 0.65257 0.86967 - - - - N 必須 0.64107 0.86458 - - - - N DeepSRDCF 0.64073 0.84881 - - - - Y シント 0.63495 0.85064 - - - - Y LCT 0.62786 0.84802 - - - - N SRDCF 0.6262 0.83795 - - - - N SiamFC 0.61217 0.81532 - - - - Y SiamFC_{3s} 0.60829 0.80922 - - - - Y CF2 0.60466 0.8907 - - - - Y HDT 0.60279 0.88853 - - - - Y ステープル 0.59952 0.79256 - - - - N FCNT 0.59902 0.85587 - - - - Y CNN-SVM 0.5971 0.85159 - - - - Y SCT 0.59526 0.84546 - - - - Y DLSSVM 0.58915 0.82884 - - - - Y SAMF 0.57935 0.78495 - - - - N RPT 0.57694 0.8045 - - - - N ミーム 0.56596 0.83004 - - - - N DSST 0.55386 0.73705 - - - - N CNT 0.54475 0.72309 - - - - Y TGPR 0.5294 0.76612 - - - - N KCF 0.5138 0.73999 - - - - N

各論文の読書メモは後日ゆっくりアップします〜。

そして最後に、素晴らしいリンクを紹介します。https://javascript.ctolib.com/foolwood-benchmark_results.html#articleHeader6