CVPR 2016 記事全文まとめ読み
<スパン 読んだことを説明するために <スパン CVPR2016 すべての論文のアブストラクトを要約すると、アブストラクトにはイノベーションの部分だけが残されています。
<スパン オーラルセッション
<スパン <スパン 画像キャプションと質問応答
6月27日(月)9:00AM - 10:05AM.
これらの論文は、下記でも発表されます。 <スパン ポスターセッション
<スパン 1 <スパン <スパン ディープコンポジション キャプション <スパン : ペア学習データなしで新しいオブジェクトカテゴリを記述する。 <スパン
リサ・アン・ヘンドリックス、スバシニ・ヴェヌゴパラン、マーカス・ロールバック、レイモンド・ムーニー、ケイト・サエンコ、トレバー・ダレル
大まかな仕事は、画像で同じことができることです - ステートメントライブラリに登場しないオブジェクトも記述されています。 本研究では、画像と文のペアデータセットに存在しない新規オブジェクトの記述を生成するタスクに取り組むため、Deep Compositional Captioner (DCC)を提案する。
2 <スパン <スパン 曖昧さのないオブジェクトの生成と理解 説明文 <スパン . <スパン
<スパン 毛俊花、黄ジョナサン、アレクサンダー・トシェフ、オアナ・カンブル、アラン・L・ユイル、ケヴィン・マーフィ
は画像記述の一形態でもあり、著者らはこのような画像記述は客観的な指標で評価できることを述べている。 画像中の特定の物体や領域に関する曖昧さのない記述(参照表現)を生成し、さらにその表現を理解・解釈してどの物体を記述しているかを推論できる手法を提案する。
<スパン 3 <スパン 画像質問応答のための積層型アテンションネットワーク.
<スパン 楊子超、何暁東、高建峰、李登、アレックス・スモラ
この記事は、例えば画像に何人写っているかを聞いて、それに応じた回答をするようなクイズに使われていますが、これはもっと難しく感じますねああ。ここでの工夫は、積み重ねられたネットワークを利用したことです。 本論文では、画像から自然言語の質問に答えることを学習する積層型アテンションネットワーク(SAN)を紹介する。
4 ダイナミックパラメータ予測を用いた畳み込みニューラルネットワークによる画像質問応答.
<スパン ノ・ヒョヌ、ソ・ポールホンスク、ハン・ボヒョン
イメージクイズ、ここでの革新的な点は、適応型パラメータレイヤの追加です。 GRU を学習させます。 我々は、質問に基づいて適応的に重みが決定される動的パラメータ層を持つ畳み込みニューラルネットワーク(CNN)を学習することで、画像質問応答(ImageQA)問題に取り組む。
5 ニューラルモジュールネットワークス
ジェイコブ・アンドレアス、マーカス・ローバッハ、トレバー・ダレル、ダン・クライン
目標も画像クイズで、表現問題と言語モデルの2つを同時に考えるという革新的なものです(ぎこちない、同時に考えているのではないのか)。まだよく見ていない。 私たちのアプローチは、質問を言語的な部分構造に分解し、これらの構造を用いてモジュラーネットワーク(犬の認識、色の分類などの再利用可能なコンポーネント)を動的にインスタンス化するものです。
<スパン
<スパン スポットライト・セッション
<スパン <スパン 言語とビジョン
<スパン 6月27日(月)午前10時05分~午前10時30分。
これらの論文は、下記でも発表されます。 <スパン ポスターセッション
<スパン 6 細密な視覚的描写の深層表現を学習する。 <スパン
スコット・リード、ゼイネップ・アカタ、ホンラック・リー、ベルント・シール
<スパン 加工方法 <スパン ゼロショット の問題で、イノベーションのポイントをよく見ずに 大きく2つに分かれていて、タイトルを見る限り、本当にディープラーニングを使ってきめ細かい特徴表現を得ようというものです。 私たちが提案するモデルは、画像のきめ細かいカテゴリー固有の内容に沿うようにエンドツーエンドで学習します。自然言語は、カテゴリーを区別するために顕著な視覚的側面のみを符号化する柔軟でコンパクトな方法を提供します。
<スパン
7
<スパン
強い監視下でのマルチキュー・ゼロショット学習。
<スパン
ゼイネップ・アカタ、マテウシュ・マリノフスキ、マリオ・フリッツ、ベルント・シール
であるけれども
ゼロショット
が、関係ない。ディープラーニングの扱い方ではない
8
ゼロショット分類のための潜在的埋め込み。
<スパン
Yongqin Xian、Zeynep Akata、Gaurav Sharma、Quynh Nguyen、Matthias Hein、Bernt Schiele
であるけれども
ゼロショット
が、関係ない。ディープラーニングの扱い方ではない
9
特徴量軌跡転送によるシーン位置の一発学習.
<スパン
ローランド・クウィット、セバスチャン・ヘーゲンバート、マーク・ニーツァマー
であるけれども
ワンショット
, しかし、関連性がない。ディープラーニングの扱い方ではない
10
<スパン
属性の学習は、マルチソースの領域汎化に等しい。
<スパン
チュアン・ガン、ティエンバオ・ヤン、ボーチン・ゴング
ディープラーニングの処理方法ではありません。
<スパン 11 <スパン ラベル付けされていない映像から視覚表現を予測する。 <スパン
カール・フォンドリック、ハメッド・ピルシアバシュ、アントニオ・トラルバ
その核心は、ディープラーニングを使って、次の瞬間や時間帯の行動行動を予測することです。 ラベルのない映像の時間構造を利用して、人間の行動や物体を予測する学習を行うフレームワークを紹介します。我々のアプローチの背後にある重要な考え方は、将来的に画像の視覚的表現を予測するためにディープネットワークを訓練することができるということです。
<スパン
<スパン オーラルセッション
<スパン マッチングとアライメント
6月27日(月)9:00AM - 10:05AM.
これらの論文は、下記でも発表されます。 <スパン ポスターセッション
<スパン 12 <スパン 特徴点への方位の割り当ての学習。 <スパン
Kwang Moo Yi, Yannick Verdie, Pascal Fua, Vincent Lepetit (クワン・ムー・イー、ヤニック・ヴェルディ、パスカル・フア、ヴァンサン・ルプティ
内容は、マッチングアルゴリズムに用いる特徴点の向きをディープラーニングで較正し、新たに提案した 活性化 関数を使用します。 ここでは、特徴点を中心とした画像パッチが与えられたときに、特徴点に正準方向を割り当てる畳み込みニューラルネットワークの学習方法を示す。
<スパン 13 <スパン 3Dガイドサイクル一貫性による密な対応関係の学習。 <スパン
<スパン Tinghui Zhou、Philipp Krähenbuhl、Mathieu Aubry、Qixing Huang、Alexei A. Efros
同じくディープラーニングを用いて、インスタンス間の類似性を探ることを目的としています。 この一貫性を監視信号として利用し、同じカテゴリのオブジェクトを描いた画像のペア間のクロスインスタンス対応を予測する畳み込みニューラルネットワークを学習させる。
14
グローバル・パッチ・コライダー
<スパン
Shenlong Wang、Sean Ryan Fanello、Christoph Rhemann、Shahram Izadi、Pushmeet Kohli
<スパン
ディープラーニングではありません。
15
を用いた確率的共同マッチング
m
-ベストソリューション
<スパン
Seyed Hamid Rezatofighi、Anton Milan、Zhen Zhang、Qinfeng Shi、Anthony Dick、Ian Reid
<スパン
ディープラーニングではありません。
<スパン 16 <スパン 大きなポーズでの顔のアライメント。3Dソリューション。 <スパン スパン
<スパン Xiangyu Zhu、Zhen Lei、Xiaoming Liu、Hailin Shi、Stan Z. Li
ディープラーニングを用いた3D顔補正技術を提案する。 3つの問題に対して、3D Dense Face Alignment (3DDFA)と呼ばれる新しいアライメントフレームワークで解決策を提案する。このフレームワークは、畳み込みニューラルネットワーク(CNN)を介して密な3D顔モデルを画像にフィットさせるものである
<スパン
<スパン スポットライト・セッション
<スパン <スパン セグメンテーションと輪郭検出
6月27日(月)10:05AM - 10:30AM.
これらの論文は、下記でも発表されます。 <スパン ポスターセッション
<スパン
17
キュー選択によるRGBD画像の対話型セグメンテーション。
<スパン
Jie Feng、Brian Price、Scott Cohen、Shih-Fu Chang
<スパン
ディープラーニングではありません。
18
オクルージョンCRFによるレイヤーシーン分解。
<スパン
<スパン
チェン・リュー、プシュミート・コーリー、古川康隆
<スパン
ディープラーニングではありません。
<スパン 19 <スパン <スパン アフィニティCNN。図/地面を埋め込むための画素中心の対関係学習. <スパン
マイケル・メア、業平拓也、ステラ X. ユー
を得るためのディープラーニング。 親和性 の行列を作成します。関心が薄い。 この親和性行列を定義するペアワイズ関係を直接予測するために、畳み込みニューラルネットワーク(CNN)を学習させます
20
弱補佐付きオブジェクトバウンダリ。
アンナ・ホレワ、ロドリゴ・ベネンソン、モハメド・オムラン、マティアス・ハイン、ベルント・シール
<スパン
ディープラーニングではない
<スパン 21 <スパン 完全畳み込み型エンコーダ・デコーダネットワークによる物体輪郭検出.
ヤン・ジメイ、ブライアン・プライス、スコット・コーエン、ホンラック・リー、ミン・スアン・ヤン
完全畳み込み符号化復号化ネットワークに基づく輪郭認識アルゴリズムの提案。 完全畳み込みエンコーダ・デコーダネットワークによる輪郭検出のための深層学習アルゴリズムを開発する。
<スパン
<スパン ポスターセッション
<スパン ポスターセッション1-1. 6月27日(月)10:30AM - 12:30PM.
<スパン <スパン 画像と言語
22 <スパン 言語問題に対する視覚的な高レベルの明示的概念はどのような価値を持つか? <スパン
<スパン Qi Wu, Chunhua Shen, Lingqiao Liu, Anthony Dick, Anton van den Hengel(チー・ウー、沈春花、劉玲橋、アンソニー・ディック、アントン・ファン・デン・ヘンゲル
画像記述について考察しているが、既存の手法は画像中のオブジェクトを直接テキスト情報にマッピングし、上位の意味情報を考慮していないため、上位の情報を考慮するための革新的なポイントを提案している。 成功したCNN-RNNアプローチに高レベルの概念を組み込む方法を提案し、画像キャプションと視覚的質問応答の両方で、最先端技術に対する大幅な改善を達成することを示す。
<スパン <スパン エッジ輪郭の検出
<スパン
23
低SNRで曲がったエッジを高速に検出。
ナティ・オフィール、メイラフ・ガルン、ボアズ・ナドラー、ロネン・バスリー
<スパン
ディープラーニングではありません。解決した問題は、ノイズを除去しながらエッジ検出することに相当します。
<スパン 24 <スパン スケール関連ディープサイド出力の融合による自然画像中のオブジェクトスケルトン抽出.
<スパン Wei Shen, Kai Zhao, Yuan Jiang, Yan Wang, Zhijiang Zhang, Xiang Bai
フルコンボリューショナルネットワークを用いた骨格抽出アルゴリズムが提案されていますが、これは前のブログで見た記事と同じような感じですね。 本論文では、この問題を解決するために、スケールに関連した複数の側出力を持つ完全畳み込みネットワークを紹介する。ネットワーク内の連続したステージの受容野サイズと、それらが捉えることのできるスケルトンのスケールとの関係を観察することで、各ステージにスケールに関連したサイド出力を導入している
25 <スパン より良いエッジ検出のためのリラックスしたディープスーパーヴィジョンの学習。
<スパン ユウ・リウ、マイケル・S・ルー
深層学習ベースのエッジ検出アルゴリズム。エッジ検出のために、畳み込みニューラルネットワーク内の緩和された深層監視(RDS)を使用することを提案する。
26 <スパン 文脈の深い探索によるオクルージョン境界の検出。 <スパン
<スパン フアン・フー、チャオホイ・ウォン、ダチェン・タオ、マイケル・J・ブラック
オクルージョンエッジ検出。ディープラーニングに基づく 本論文では、文脈情報(局所的な構造境界パターン、周辺領域からの観測、時間的文脈など)の探索を強化することでオクルージョン境界検出を改善し、その際に畳み込みニューラルネットワーク(CNN)と条件付きランダムフィールド(CRF)に基づく新しいアプローチを開発します。
27
セミコントゥア 半教師付き学習による輪郭検出のためのアプローチ.
<スパン
張子肇、興芙蓉、石暁翔、楊琳
<スパン
ディープラーニングではありません。輪郭検出です。
<スパン <スパン 特徴抽出と説明
<スパン
28
小さなランドマークのローカライズを学ぶ。
<スパン
サウラブ・シン、デレク・ホイム、デヴィッド・フォーサイス
ディープラーニングではなく、特徴抽出。
<スパン 29 <スパン <スパン インターアクティブ 層間活性度伝搬。
<スパン Lingxi Xie, Liang Zheng, Jingdong Wang, Alan L. Yuille, Qi Tian
に相当します。 活性化 関数を改良したものです。 本論文では、神経細胞やネットワーク接続の活性度を計算する新しいアルゴリズムであるInterActiveを紹介する。
30 マルチラベル物体認識のためのバウンディングボックスアノテーションの活用。 <スパン
<スパン Hao Yang, Joey Tianyi Zhou, Yu Zhang, Bin-Bin Gao, Jianxin Wu, Jianfei Cai
マルチラベルのターゲット認識にディープラーニングを利用したアルゴリズムは、実はマルチターゲット認識なのです。 本論文では、特徴量の識別力を高めるために、局所情報を取り入れる。
31 <スパン TI- プーリング : 畳み込みニューラルネットワークにおける特徴量学習のための変換不変プーリング.
ドミトリー・ラプテフ、ニコライ・サヴィノフ、ヨアヒム・M・ブフマン、マーク・ポレフェイス
新しい <スパン プーリング というアルゴリズムがあります。 この論文では、簡単に実装できる変換不変プーリング演算子(TI-pooling )を組み込んだディープニューラルネットワークトポロジーを紹介します。
32
128個の浮き輪でファッションスタイル。特徴抽出のための弱いデータを使用した共同ランキングと分類.
エドガー・シモセーラ、石川浩司
<スパン
ディープラーニングではありません。
33
等角カーネル辞書学習と動的テクスチャ解析への応用.
<スパン
<スパン
ユウホイ・クァン、チェンクロン・バオ、ホイ・ジ
<スパン
ディープラーニングではありません。
34
Compact Bilinear Pooling。
<スパン
<スパン
ヤン・ガオ、オスカー・ベイボム、ニン・チャン、トレバー・ダレル
<スパン
ディープラーニングではありません。
<スパン 特徴抽出とマッチング
<スパン
35
累積安定度投票。複数の尺度の記述子からなるロバストな記述子.
<スパン
ヤン・ツンイー、リン・イェンユー、チュアン・ユンユー
<スパン
ディープラーニングではありません。
36
CoMaL:オブジェクトの境界でマッチングする良い機能。
<スパン
スワルナ・K・ラビンドラン、アヌラーグ・ミッタル
<スパン
ディープラーニングではありません。
37
交互記述子の選択とコレスポンデンス・エンリッチメントによるプログレッシブ・フィーチャーマッチング(Progressive Feature Matching With Alternate Descriptor Selection and Correspondence Enrichment).
<スパン
<スパン
ユアンティン・フー、イェンユー・リン
<スパン
ディープラーニングではありません。
<スパン 画像セグメンテーション
<スパン
38
画像分割と閉じた輪郭の検出のための曲率ペナルティを用いた新しいフィンスラー最小経路モデル.
ダ・チェン、ジャン=マリー・ミレボー、ローラン・D・コーエン
<スパン
ディープラーニングではありません。
39
階層的画像分割のスケールアウェアアライメント.
<スパン
<スパン
陳玉華、戴登心、ジョルディ・ポン・テュセ、リュック・ヴァンゴール
<スパン
ディープラーニングではありません。
<スパン 40 <スパン <スパン ディープ・インタラクティブ・オブジェクト・セレクション。 <スパン
<スパン ニン・シュー、ブライアン・プライス、スコット・コーエン、ジメイ・ヤン、トーマス・S・ホァン
ディープラーニングの相互作用でターゲット認識?選択? 本論文では、物体らしさをよりよく理解し、ユーザーとのインタラクションを数クリックに減らすことができる、新しいディープラーニングベースのアルゴリズムを紹介します。
41
<スパン
プラグを抜く?コンピュータと人間のどちらが画像を分割すべきかを予測する。
<スパン
ダンナ・グラーリ、スヨグ・ジェイン、マルグリット・ベトケ、クリステン・グラウマン
<スパン
ディープラーニングではありません。
<スパン
42
影で、形状の優先順位が輝く。オクルージョンを利用して多領域のセグメンテーションを向上させる。
<スパン
木原由佳、マトヴェイ・ソロヴィエフ、ツハン・チェン
ディープラーニングだが、ほとんど興味がない。
<スパン
43
画像セグメンテーションのための凸形状制約.
<スパン
ロイック・A・ロワイエ、デビッド・L・リッチモンド、カーステン・ロザー、ビョルン・アンドレス、ダグマー・カインミュラー
<スパン
ディープラーニングではありません。
<スパン
44
<スパン
関連
-
undefinedGoogLeNet 論文の翻訳 - 英語と中国語で書かれています。
-
カーネルが死んだようです」の解決法。自動的に再起動します" の解決方法
-
TypeError: 'module' object is not callable solution to [Keras] call "merge".
-
AttributeError: 'tuple' オブジェクトには 'log_softmax' という属性がありません。
-
MaxentClassifier.train() でエラー発生 AttributeError: 'list' オブジェクトに 'items' 属性がない
-
CS231n コースワークの KNN の実装における問題: np.bincount() Location ValueError: object too deep for desired array.
-
[ディープ・アプリケーション】 ・ディープラーニングの主流ハードウェアの速度比較(CPU、GPU、TPU)
-
ERROR: Command errored out with exit status 1: python setup.py egg_info 完全なログを確認してください。
-
tensorflowプロセスのインストールについて 「Consider using `--user` option or check the permissions」エラー
-
Yolov3のベゼル予測について、これまでで最も詳細な分析を行いました。
最新
-
nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)
-
htmlページでギリシャ文字を使うには
-
ピュアhtml+cssでの要素読み込み効果
-
純粋なhtml + cssで五輪を実現するサンプルコード
-
ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード
-
タイピング効果を実現するピュアhtml+css
-
htmlの選択ボックスのプレースホルダー作成に関する質問
-
html css3 伸縮しない 画像表示効果
-
トップナビゲーションバーメニュー作成用HTML+CSS
-
html+css 実装 サイバーパンク風ボタン
おすすめ
-
などの警告を出しながらFaster-RCNNを実行します。RuntimeWarning: invalid value encountered in greater_equal などの警告が表示されます。
-
ターゲット検出ベースモジュール(iou/giou/ciou/diou)のIoU概要
-
py-faster-rcnn/lib の make でエラー: コマンドラインオプション '-Wdate-time' が認識されない
-
xx.exe の 0x00007FF7A7B64FB3 でスローされた例外: 0xC0000005: 場所 0x00 を読み取るアクセス違反
-
tensorflowをインポートしています。ImportError: libcublas.so.9.0: cannot open shared object file: No such file or director
-
OrderedDict' オブジェクトに 'eval' 属性がありません。
-
keras AttributeError: 'NoneType' オブジェクトに属性 '_inbound_nodes' がない。
-
tensorflowエラーノート:PyCharmとAttributeErrorの下で様々なモジュールのインポートの問題:モジュール 'pandas.core.computation' は属性を持っていません。
-
ImportErrorに対する完璧な解決策。cv2 という名前のモジュールがない! (あまりすごいことはできませんが)
-
TensorFlow2、カスタム写真のDIYデジタルペイントのためのニューラル・スタイル・マイグレーションを実装