ディープラーニングの手法「CNN」の画像識別処理がアニメーションで理解できる「CNN Explainer」

📆 2020/07/07 11:00:00
📰 gigazine

⏱ Reading Time:
29 sec. here
2 min. at publisher
📊 Quality Score:
News: 15%
Publisher: 51%

日本見出しニュース

日本最新ニュース,日本見出し

「AI」や「機械学習」といった言葉を耳にすることが増えていますが、その仕組みを理解するのは難しいと感じる人もいるはず。ジョージア工科大学のAIに関する研究チームであるPolo Clubが、機械学習の代表的なモデルである畳み込みニューラルネットワーク(CNN)を視覚的に理解できるウェブアプリ「CNN Explainer」を公開しています。

クリックすると、入力に対する出力と、その計算過程を示す画面が表示されました。CNNの畳み込み層では、カーネルと呼ばれるニューロン固有の値である多次元配列と、画像の一部分を表すカーネルと同じ大きさの多次元配列について、各要素の積の和である

を計算することで、そのウィンドウの特徴を抽出した数値を出力するとのこと。下の画像では、[-0.3, -0.21, 0.07；-0.19, 0.1, -0.01；-0.04, -0.02, 0.08]という3次元のカーネルと、[0.18, 0.17, 0.18； 0.7, 0.17, 0.16；0.16, 0.16, 0.16]で表される3次元のウィンドウとのドット積である「-0.09」というウィンドウの特徴を抽出した値を導いています。さらに、カーネルは1ピクセルずつ移動し、対応するウィンドウの要素とのドット積を計算し続けていきます。この移動はストライドと呼ばれます。カーネルのストライドを経て、64×64ピクセルの画像データから62×62ピクセルの画像データが抽出されています。

上記の処理が赤、青、緑の入力に対してそれぞれ行われ、その中間結果がバイアスとともに合算されて2次元のテンソルが畳み込み層で出力されています。この出力は特徴マップと呼ばれ、同様の処理が畳み込み層の他のニューロンにおいても行われます。CNN Explainerでは、赤、青、緑に対応する3つの入力から10の特徴マップを出力しているので、カーネルは3×10＝30種存在することになると説明されています。

コメントを書く

このニュースをすぐに読めるように要約しました。ニュースに興味がある場合は、ここで全文を読むことができます。続きを読む:

日本最新ニュース, 日本見出し

Similar News:他のニュースソースから収集した、これに似たニュース記事を読むこともできます。

日本 最新ニュース, 日本 見出し

日本最新ニュース, 日本見出し