最近のAIはとても高度になってきていて、
でも、いわゆる、
”考えてはいない”
問題で、精度に問題があったりしますが、
”概ね良い結果”が”簡単に得られる方法”の一つとして、地位を確立してきました。
現在作られて居る者の殆どは、条件反射的な動作です。
多数の入力(注:とても多い)の入力を、何回かノードを経由することで、正しいとして登録されたことのあるパターンに集約することで、今までに無い入力に対して、概ね良い結果を得られるようにしています。
良く有る深層学習のモデルに使われているような、2,3の入力から、いくつかの、ノードが条件分岐して、結果を出すわけではありません。
たとえば・・・・・画像認識(ネコとか、人とかっていう分別)を行う者は、入力された画像情報の全てのドットに対応するような入力装置が必要になります。
640×480(SD解像度)用のAIであれば、入力が30万個必要と言うことになります。
それぞれの入力端はRGBかモノクロかは判りませんが、ただ一つの色情報だけを受け取ります。
それにだけで結果を出します。
これまでに学習したことのあるネコ情報と似た値であれば、大きな数値、似ていなければ小さい数値を出します。
まぁ、回転やサイズ変更などにも対応するのであれば、事前処理の様な段階も要ります。
たとえば、数値の大小だけで、単純判別を行った結果を出し、いわゆる、エンボス化や輪郭抽出みたいな処理ですね?そして、以前学習した結果のそれらの情報の中に類似の物があるか確認して、
あれば、サイズ変更や回転処理などを行ってから、本来のAI的な処理の部分に回せば精度が上がるかも知れませんね?
まぁ、そういう事をしたり、しなかったりしながら、前の段から出力された、複数の結果を処理して、次の段へ結果を出力します。
これらを複数段経過することで、以前ネコと判定したものと同じ用な結果が得られると、ネコと判別するわけです。
ハッキリ言いましょう、それぞれの段階では、何か特別な処理をしているわけでは無いのです。
加算や、乗算、除算、そういう事を適当に繰り返した結果、それだけで判別するのです。
三毛猫に対して何度も学習させた結果のAIでは、アメリカンショートヘアを認識することは出来ないでしょう。
でも、両方を学習させたものなら、どちらも判別が出来る様になるのでしょうね
ようするに、Negative(間違い)とSuccess(成功)を適度に行うことで、
たとえば、先ほどのような単純な画像入力装置から作られた三毛猫判別期の場合、
黒、白、茶色があるかどうかとか、そう言う単純な機能にならずに済むわけです。
条件として
ネコ全体が映っていること
が、当面は必要かも知れませんが、
それをただひたすらに繰り返して、もっと細かく、正確にネコ判定できるようにするのです。
さて、ここで重要なのは、途中の計算式ではないのです。
加算でも乗算でも、何でも構わないのです。
大量の式を経由した結果、色々な画像に対して特有の数値が出るようになっていれば、ネコ判別は可能になるのです。
これは、MD5などのハッシュ情報に似ています。
単純で下等なAIはハッシュ情報の蓄積でしか無いと言うことです。
では、それらをどうやって中等なり、上等にするのかということになります。
そのために必要なのが、シーン情報です。
それが、絵なのか、写真なのか、写真の写真なのか、朝なのか、昼なのか、夜なのか? 室内か室外か?
そういう事の判定が特に重要になります。
それによって、まず映っていそうな者が特定できます。
室内 の 写真に 自動車が映っていることはまずありません。
何処かの博物館か、窓の外に見えているか、玩具か、写真くらいでしょうか?
場所のサイズを検出し、それが本物かどうかなど、色々なことを判別することが出来ます。
たった一枚の絵からどれだけの情報をAIに渡せるのか、そこが重要になってきます。
まぁ、そもそも人間同士であれば、
「山行ってきたんだ〜」って山の写真を見せたりするので、
事前情報も無く、木だけが移っている写真見ても、人間でもわからないですよね?
|