ディープラーニングっていったい何?簡単に要点をまとめてみた!!

今、巷で話題の人工知能、そしてその中心にあるのがディープラーニングといわれるものです。

でも、ディープラーニングていったい何かといわれて説明できるほど、よくわからないですよね。

簡単に説明するとディープラーニングとはニューラルネットワークを使って機械学習を進化させた人間が行う認知ができるようにする方法ですが、こう説明されても「???」だと思います。

そこでもう少し基本的なところから、ディープラーニングについて書いてみたいと思います。

プログラミングを習得するならこちら↓↓↓。


ディープラーニングが注目された理由

そもそもなんでディープラーニングがこれほどまでに注目されたのかというと、2012年に開催された画像認識コンテスト、ImageNet Large Scale Visual Recognition Challengeで、カナダ・トロント大学のチームがディープラーニングを使った画像認識システムによってほかのチームに圧勝したことから注目され始めました。

ディープラーニングの活用状況

ディープラーニングは今、世界で最も研究されている分野で、海外での企業や研究機関への導入が飛躍的に伸びている分野です。

しかし日本でのディープラーニング(人工知能)の活用状況はというと、その他の先進諸国に比べてそれほど普及していないのが現状です。

下の表は2016年時点での日本とドイツ、アメリカのAI導入状況を示していますが、日本はダントツの最下位。

「AI導入する予定がない」が80%もあるのは驚きです。


引用 MMRI

次に、下の表を見てみましょう。

これは日本の2016年の業種別AI導入の割合を調べたものですけど、金融と情報通信業がそれぞれ7.8%と6.9%導入している以外は導入率は軒並み1%以下になっているのが日本の現状なんですね。


引用 MMRI

でもこの状況は逆に言うと、これからAI市場にはかなりの伸びしろがあるとも言えるでしょう。

ディープラーニングとは

ディープラーニングはすごいかもしれないというのは分かったけど、今一つしっくりこないことがありますよね。

それは、ディープラーニングと人工知能そして機械学習の関連性ではないでしょうか。

これらの三つの言葉がどう関係しているのかがわからないと、ディープラーニングも人工知能も理解できなくなってしまいますので、そこをまずそこをしっかりと定義したいと思います。

下の表を見てもらうと、人口知能の研究って1950年代から始まっていたんですね。

でもディープラーニングが登場する2010年第までは、人口知能って実用化の話が出ていなかったというのが現状のようですね。


引用:NVIDIA

それだけ、トロント大学のディープラーニングを使った画像認識システムはすごいものだといことなんですね。

上の表を見てみると、人口知能っていう漠然とした概念から機械学習を経てディープラーニングに絞られてきた。

つまり「人工知能(AI)>機械学習>ディープラーニング」っていう構造になっているんですね。

つまりディープラーニングは、人工知能という大きな概念に含まれる要素のうち最も注目されているものの一つということになります。

このディープラーニングを核とした人口知能を実生活に活用するために各国、各企業そして研究機関などが開発にしのぎを削っていうのが今ということになります。

もう少し詳しく見ていきましょう。

AIとは何?

AIって範囲が広いので、それはいったい何って聞かれると結構答えに困ったりしてしまう。

オンラインディクショナリーのweblioによると、AIとは「AIとは、人間の知的営みをコンピュータに行わせるための技術のこと、または人間の知的営みを行うことができるコンピュータプログラムのことである。一般に「人工知能」と和訳される。」だそうです。

まあ何となく人間の営みのうち、機械ができることは任せてしまうためのシステムって考えておけばいいのかと思います。

強いAIと弱いAI

一口にAIって言っても、何やら2種類あるようでしてそれが強いAIと弱いAIって言われるやつなんです。

強いAIと弱いAIの大きな違いは、AIが人間のように自分で判断して人間のように処理ができるかどうかですね。

引用:オルタナティブ・ブログ

強いAIの定義っていうのが、人間と同じような知的処理をすることができる機械。

つまり、人造人間の世界になりますね。

それに対して弱いAIの定義は人間の知的処理の一部代行というができるようになるというのが弱いAIといっていいでしょう。

今世界各国で研究されているのは、主に弱いAIの方でその中でもある一定の作業を行うことに特化した特化型といわれるものが研究の主流になってます。

機械学習とは何?

機械学習は、ウィキペディアによると「人工知能の研究課題の一つで、人間が自然に行っている学習能力と同様の機能をコンピュータで実現しようとする技術・手法」。

つまり機会に何らかの学習をさせることで、人間が行っている知的処理を代替えさせる技術のことです。

まず機械にデータを入力し、機械がそれを学習することで煽れぞれのパターンや規則・関係性などを抽出しルールを形成していくことで生活の様々な場面に役立てていくものです。

引用:オルタナティブ・ブログ

マシーンラーニングと一口に言っても、そのやり方には大きく分けて「教師あり学習」「教師なし学習」「強化学習」の三つがあります。

教師あり学習

教師あり学習とは問題(データ)と正解を同時に与えることで機械に何が正解かを学習させる方法で、数値の予測(回帰)や物の分類(ラベリング)などに使われます。

教師ありデータは機械学習にもっとも適しているといわれ、教師データがあればあるほど適切なデータを導きだすことができるのです。

教師なし学習

データは与えるが、教師(正解)は与えず機械のアウトプットを外的な基準なしに分類したり、抽象的な概念で答えをまとめるのに役立ちます。

残念ながら実用化にはいくつかの課題があるが、教師データがない場合アウトプットを教師データ作成の参考にすることもできるのです。

強化学習

強化学習とは、ある環境下にあるマシンがその環境を学習しその中で取るべき行動を選択することができるようにするための学習です。

正しい行動を選択することで、環境から報酬を得ることができ、例としては将棋やチェスなどで使われるマシンなどがそれにあたる。

プログラミングを習得するならこちら↓↓↓。


結局Deep Learningって何?

ディープラーニングは上に書いた機械学習技術のコアの部分にあたり、ディープラーニングのがなければ機械学習は成り立たたなくなっているのです。

そしてディープラーニングを成り立たせているのが、ニューラルネットワークを用いた学習ということになりますが、カナダ・トロント大学のチームがニューラルネットワークを発表するまでは、ほとんど注目されてきませんでした。

しかし、現在ではニューラルネットワーク無しでは機械学習ではないというくらいまで認知されています。

ニューラルネットワークがこれだけ進化してデータ処理を行うことができるようになった理由はというと、インターネットの進化によって大量のデータを取得することが可能になったこと。

そしてGPUのように画像を専門に演算(説明が難しい)するプロセッサーを内蔵したコンピューターなどハードウエアの発達。

そして最後に、たゆまぬ研究の結果生み出されたのがディープラーニングなんです。

ディープラーニングは何がディープなのか

ディープラーニングがなぜディープなのかというと、ニューラルネットワークの構造がディープという意味です。

通常の機械学習においてニューラルネットワークは3層構造になっています。

データはすべて入力層にインプットされ、中間層に出力処理され、結果が最後の出力層から出力されるのです。

そしてデータ処理の中枢ともいえる中間層が二つ以上のニューロンの層からできている学習手法をディープラーニングと呼んでいます。

引用:Think It

そしてディープラーニングが注目されてる最も大きな理由の一つが、人間が関与しなくても自動的に機械が入力したデータの特徴を抽出してくれることです。

そして二つ以上の中間層ニューラルネットワークがあるからこそそれができるのです。

しかし、一口にディープラーニングといってもデータの種類に最も適切な処理方法があるんです。

大きく分けて三つの処理方法があります。

  • DNN (Deep Neural Network)
  • CNN (Convolutional Neural Network)
  • RNN (Recurrant Neural Network)

DNN (ディープニューラルネットワーク)

ディープニューラルネットワークとはいわゆるよく知られた何層にも重なったニューラルネットワークで、前の層から受けた出力を基にそれら以外のデータ的特徴を学習し次の層に出力していくアルゴリサムを行う仕組みです。

人間や、動物の脳にあるニューラルネットワークをモデルにして開発されたネットワークで、ディープラーニングの基礎的なニューラルネットワークといえるでしょう。

CNN(コンボルーショナルニューラルネットワーク)

コンボルーショナルニューラルネットワークとは、いわゆる畳み込みニューラルネットワークのことで、現在のディープラーニングで最も研究されているニューラルネットワークの仕組みです。

CNNは主に画像認識に対して高い学習能力を持ったニューラルネットワーク。

これがどのようなものかを簡単に説明すると、一つの画像を複数のカテゴリに分解して学習するようにプログラムされたニューラルネットワークです。

文字で説明するのは難しいので、下の図をちょっと見てください。

引用:人工知能エンジニア修行日記

引用先の「人口知能エンジニア修行日記」を見ていただくとイメージがばっちりわいてくると思うのですが、複数のピクセルを一つのピクセルに畳み込ん新しいイメージを再生するというイメージでいいでしょう。

従来のディープニューラルネットワークではなくこのCNNが開発された理由はというと、従来のDNNではデータの形状がすべて無視されてしまうためなのです。

画像には、3次元的な情報が億含まれたいますが、従来のDNNではその情報をすべて均して数値化してしまうのが問題でした。

そのため画像の形状を維持し、画像データが損なわれないように開発されたのが畳み込みニューラルネットワークなのです。

RNN(リカレントニューラルネットワーク)

DNN(ディープニューラルネットワーク)が数値を検証するのに最適なアルゴリサムならCNN(コンボルーショナルニューラルネットワーク)は画像処理に最適なニューラルネットワーク。

そしてRNN(リカレントニューラルネットワーク)はューラルネットワークの計算に前後の時系列情報を組み合わせることができる、自然言語処理に最も適したニューラルネットワークになります。

ディープラーニングでできること

これまでディープラーニングはこんなものだということを書いてきました。

では、実際にディープラーニングで何ができるのでしょうか?

ディープラーニングでできることは一言でいうと「認知」だけです。

つまり、画像を認知したり数字のパターンを認知したり、音声を認知することです。

逆に言うと、それ以外のことはできないのです。

しかし、認知ができるということはどういう意味かというとそれまで人間しか行えなかった、作業を機械が代行できる可能性が広がったということです。

例えば画像認識能力をディープラーニングすることで、工業製品ラインで行っていた目視による選別を機械が行うことができるようになること。

また、情報ネットワーク上での異常検知などの認知を必要とする様々な分野に追うようすることができるのが、ディープラーニングです。

ディープラーニングの歴史は浅いですが、内容はまさにディープで素人が奥深く入りこむのはなかなか難しいかもしれません。

でも2030年には人工知能市場は3兆円規模のものになるということなので、今の段階から初めておくのもありかなって考えています。

プログラミングを習得するならこちら↓↓↓。


  • このエントリーをはてなブックマークに追加

コメントをどうぞ

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です