深い学習:それはどのように機能しますか?パート1

この記事では、あなたは学びます





-ディープラーニング本質は何ですか -



アクティベーション機能



は何ですか-FCNNとは何ですか-FCNNはどの



タスクを解決でき



ますか-FCNNの欠点とその対処方法は何ですか




簡単な紹介



これは、DLのタスク、ネットワーク、アーキテクチャ、作業の原則、特定のタスクを解決する方法、および一方が他方より優れている理由に関する一連の記事の始まりです。



すべてを理解するには、どのような予備的なスキルが必要ですか?言うのは難しいですが、グーグルや質問を正しく行う方法を知っていれば、私の一連の記事があなたが多くを理解するのに役立つと確信しています。



深い学習のポイントは何ですか?



肝心なのは、Xを入力として受け取り、Yを予測するアルゴリズムを構築することです。GCDを見つけるためのEuclidのアルゴリズムを作成する場合、サイクル、条件、割り当てを記述するだけで、そのようなアルゴリズムを構築する方法を知っています。そして、入力として画像を取り、犬や猫を言うアルゴリズムを構築する方法は?それとも何もありませんか?そして、入力時にテキストを送信して知りたいアルゴリズム-それはどのジャンルですか?ペンでサイクルと条件を書くのはとても簡単です-ここではニューラルネットワーク、深い学習、そしてこれらすべての流行語が助けになります。



より正式に、アクティベーション機能について少し



正式に言えば、入力パラメータXとネットワークWの重みから、関数から関数を構築する必要があります。これにより、何らかの結果が得られます。ここで重要なのは、単純に多くの線形関数をとることはできないということです。線形関数の重ね合わせ-線形関数。その場合、深いネットワークは2つの層(入力と出力)を持つネットワークに類似しています。なぜ非線形性が必要なのですか?予測方法を学習したいパラメータは、入力データに非線形に依存する場合があります。非線形性は、各レイヤーで異なるアクティベーション関数を使用することによって実現されます。



完全に接続されたニューラルネットワーク(FCNN)



完全に接続されたニューラルネットワーク。これは次のようになります。



画像



要点は、1つのレイヤーの各ニューロンが、次および前の各ニューロン(存在する場合)に接続されていることです。



最初の層は入り口です。たとえば、256x256x3の画像をそのようなネットワークの入力にフィードする場合、入力レイヤーに正確に256x256x3のニューロンが必要です(各ニューロンはピクセルの1つのコンポーネント(R、G、またはB)を受け取ります)。人の身長、体重、その他23個の特徴を表示する場合は、入力レイヤーに25個のニューロンが必要です。出力のニューロンの数-予測したい特徴の数。これは、1つの機能または100個すべてのいずれかになります。一般的な場合、ネットワークの出力層によって、それがどの問題を解決するかをほぼ確実に言うことができます。



ニューロン間の各接続は重みであり、ここで説明した逆伝播アルゴリズムによってトレーニングされます



FCNNはどのようなタスクを解決できますか?



-回帰の問題たとえば、国、都市、通り、交通量などの入力基準に基づいて店舗の価値を予測します。



-分類の問題たとえば、古典はMNIST分類です。



-FCNNを使用したセグメンテーションとオブジェクト検出のタスクについては言及しません。多分誰かがコメントで共有するでしょう:)



FCNNのデメリット



  1. 1つの層のニューロンには、「共通の」情報がありません(ネットワーク内のすべての重みは一意です)。
  2. 写真でネットワークをトレーニングしたい場合は、トレーニングされた膨大な数のパラメーター(重み)。


これらの不利な点についてどうしますか?Convolutional Neural Networks(CNN)は大丈夫です。これは私の次の記事になります。



結論



完全に接続されたニューラルネットワークに長い間住むことにはあまり意味がありません。誰かがそのようなネットワークの実装そのものに興味を持っているなら、ここで私の実装について見て読むことができます。



All Articles