深層学習トラッキングアルゴリズム概要
論文を読み始めて半月が過ぎたところなので、今後の検討とまとめのために感想を書いておきます。
2018.07.27
TLDはディープラーニングを用いない従来のアルゴリズムです。
DLTはターゲット追跡の分野で初めて深層学習の適用に成功したアルゴリズムであり、SO-DLTはその改良版である。
SO-DLTもFCNTも純粋にディープでエンドツーエンドのトラッキングで、FCNTは異なる層の特徴を用いてトラッキングのための異なるレベルの情報を取得していますが、ずいぶん前の話ですね。
HCFは深度特徴+従来のアルゴリズム(パーティクルフィルタリング)で、深度特徴の部分は3層の特徴を使って深度特徴を抽出するものです
MDNetは純粋な深度アルゴリズムで、それ自体で単純なCNNを構築するが、速度が遅い。
SO-DLT、MDNetともに事前学習+SGDによるオンラインファインチューニング
従来のトラッキングアルゴリズム(相関フィルタ)は、高速でリアルタイムに実行することが容易ですが、ディープアルゴリズムほど堅牢ではありません。
-------------------------------------------------------------------- split line ----------------------------------------------------------- -----------------
2018.08.03
最近読んだ本と、先輩との意見交換で学んだことを一言ずつ〜。
従来アルゴリズム MOSSEフレームレート669fps、KCFフレームレート292fps(論文EAST, ICCV2017 spotlightより)
SANetは、MDNetの改善、高精度に基づくが、速度は1fpsのみであり、アルゴリズムのリアルタイム要件を満たすことができない基本的に考慮しない、実用的ではない。
VITAL (CVPR2018): GANを用いて正のサンプルの数を拡大し、さらに高次の敏感な損失関数を用いて単純な負のサンプルが分類器学習に与える影響を軽減し、CREST (ICCV2017, spotlight) をベースに改良したバージョンです。
深度アルゴリズムのGOTURNは165fpsと高速、精度は未確認でわかりません〜〜。
ROLO(2016年ArXiv)。YOLO+LSTM
双子のネットワークSiamFC
(ECCV2016、テンプレートマッチングベース、オンライン微調整なし、86fps)が非常に便利で、SiamFCをベースにした改良版がここ2年非常にホットで、良い方向性を感じます、改良版には以下のような主記事があります。
CFNet(CVPR2017):SiamFCと同じ作者ですが、CFNetはエンドツーエンドを実現するために層を構築するニューラルネットワークのフィルタリングの理論に関連してきます(数学的スキルはかなり高い)、神を崇めよ
RFL(ICCV2017):LSTMを使用、アイデアはあるが精度があまり上がらない。
EAST (ICCV2017): 今見ているところ、次回更新予定です。
PTAV(ICCV2017)です。(名案) 速度と精度のバランス。トラッキングプロセスを2つの並行だが協調的なスレッドに分解する:1つは高速トラッキングのため、もう1つは正確な検証のため
CVPR2018では、SiamFCの改良版である4つの論文が掲載されています。
SINT++ (CVPR2018): SiamFCの利用に加え、正サンプルの数を拡張するPSGN (正サンプル生成ネットワーク) と、より難易度の高い正サンプルを生成するHPTN (ハード正変換ネットワーク) が提案されています。
サイアムRPN SiamFC + RPNネットワーク、分類と回帰の2つのブランチを出力(SiamFCでは回帰なし、マルチスケールテスト)、フレームレート160fps(オンライン微調整なし)、エンドツーエンド、シングルターゲット・トラッキング
RASNet:特徴量学習と判別学習を分離(オリジナルのSiamFCは、テスト時に
ϕ
(
.
)
\Ȃ
<スパン
<スパン
ϕ
(
<スパン
.
)
関数で両者を同時に学習させるとオーバーフィットになりやすく、CFNetでは円形行列を追加したにもかかわらず境界効果が導入されると著者らは述べている)。
テンプレートブランチ(検出ブランチは変更なし)において
まず、一般注意で全訓練サンプルの普遍的特徴を学習し、残留注意枝で現在のフレームと普遍的特徴の差を学習し、その和を現在のフレームの特徴とする。また、チャネルアテンションブランチは、特徴の重み付けに使用される。
SA-サイアム
この前の2つはまだ読んでないので、読んだら更新します~~。
----------------------------------------------------------------- split line -------------------------------------------------------------- ------------------------
今日、もっと良いまとめを見たので、ここに記録しておきます〜。
<テーブル トラッカー AUC 精度 OS (%) DP (%) CLE (ピクセル) FPS ディープラーニング MDNet 0.70767 0.94803 - - - - Y C-COT 0.6725 0.89912 - - - - N シントプラス 0.65517 0.88157 - - - - Y SRDCFdecon 0.65257 0.86967 - - - - N 必須 0.64107 0.86458 - - - - N DeepSRDCF 0.64073 0.84881 - - - - Y シント 0.63495 0.85064 - - - - Y LCT 0.62786 0.84802 - - - - N SRDCF 0.6262 0.83795 - - - - N SiamFC 0.61217 0.81532 - - - - Y SiamFC_{3s} 0.60829 0.80922 - - - - Y CF2 0.60466 0.8907 - - - - Y HDT 0.60279 0.88853 - - - - Y ステープル 0.59952 0.79256 - - - - N FCNT 0.59902 0.85587 - - - - Y CNN-SVM 0.5971 0.85159 - - - - Y SCT 0.59526 0.84546 - - - - Y DLSSVM 0.58915 0.82884 - - - - Y SAMF 0.57935 0.78495 - - - - N RPT 0.57694 0.8045 - - - - N ミーム 0.56596 0.83004 - - - - N DSST 0.55386 0.73705 - - - - N CNT 0.54475 0.72309 - - - - Y TGPR 0.5294 0.76612 - - - - N KCF 0.5138 0.73999 - - - - N各論文の読書メモは後日ゆっくりアップします〜。
そして最後に、素晴らしいリンクを紹介します。https://javascript.ctolib.com/foolwood-benchmark_results.html#articleHeader6
関連
-
undefinedGoogLeNet 論文の翻訳 - 英語と中国語で書かれています。
-
py-faster-rcnn/lib の make でエラー: コマンドラインオプション '-Wdate-time' が認識されない
-
Tensorflow 踩坑:ImportError: DLL のロードに失敗しました。指定されたモジュールが見つかりません。 TensorFlowのネイティブランタイムのロードに失敗しました。
-
OrderedDict' オブジェクトに 'eval' 属性がありません。
-
トーチの取り付けと使用
-
U-netのソースコード解説(Keras編)
-
tensorflow experience code error Adding visible gpu devices: 0 , モジュール 'tensorflow' には 'Session' という属性がありません。
-
Tensorflow-gpu2.0.0インストールとtensorflow-gpuインストール成功のテストプログラム。
-
AttributeError: 'tuple' オブジェクトには 'log_softmax' という属性がありません。
-
AttributeError: モジュール 'pandas' には 'core' という属性がありません。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
などの警告を出しながらFaster-RCNNを実行します。RuntimeWarning: invalid value encountered in greater_equal などの警告が表示されます。
-
ResNetの紹介
-
xx.exe の 0x00007FF7A7B64FB3 でスローされた例外: 0xC0000005: 場所 0x00 を読み取るアクセス違反
-
tensorflowをインポートしています。ImportError: libcublas.so.9.0: cannot open shared object file: No such file or director
-
ImportError: libSM.so.6: cannot open shared object file: そのようなファイルやディレクトリはありません
-
PackagesNotFoundError: 次のパッケージは、現在のチャンネルから利用できません ソリューション
-
Pytorch Deep Learningです。TypeError: 'builtin_function_or_method' object is not iterable エラーの解決方法
-
ロジスティック回帰は2分法モデル
-
TensorFlow実行時エラー、AttributeError: モジュール 'pandas' には 'computation' という属性がない。
-
tensorflowエラーノート:PyCharmとAttributeErrorの下で様々なモジュールのインポートの問題:モジュール 'pandas.core.computation' は属性を持っていません。