AI(人工知能)の学習を1週間してわかったことやメリット、デメリットは？

AI(人工知能)の学習を1週間だけする機会に恵まれました

書店にいくと、数々のAIの本が売られていますが、実生活ではまだまだAIが浸透したことを実感していない方が多いのではないでしょうか

実はすでにいたるところでAIの技術は使われていて、今後はさらに「AIを使ったシステムや商品はあたりまえ」になる未来がくるかもしれません

とはいえ、たったの1週間ですがAIについて学んだ中で、勉強前と後でギャップがありました

今回は「AIってなに？」という方向けに、知識0からAIについて学んでわかったことをまとめてみました

AI(人工知能)の学習を1週間してわかったことやメリット、デメリットは？

AI(人工知能)の学習を1週間してわかったことやメリット、デメリットは？

AIとは一体なんなのか？

AIというのは非常に曖昧な言葉です

人工知能（じんこうちのう、英: artificial intelligence、AI）とは、「「計算（computation）」という概念と「コンピュータ（computer）」という道具を用いて「知能」を研究する計算機科学（computer science）の一分野」を指す語。

出典: フリー百科事典『ウィキペディア（Wikipedia）』

機械学習などであればもう少しわかりやすいのですが、 AIは実に定義が難しいのです

なので、AIは非常に話題にはなっていますが、実際になんなのかは、実はわからなくて当然だったりします

AIとは、人間の知的営みをコンピュータに行わせるための技術のこと、または人間の知的営みを行うことができるコンピュータプログラムのことである。一般に「人工知能」と和訳される。

出典：IT用語辞典バイナリ

なのでAIの定義は辞書によって異なります

すっごく大雑把に言えば、「機械が人間のように考えられるようなプログラムを作ること」と言えます

がっつりと定義されていないからこそ、「AIってなに？」と聞かれても難しいわけですね

AI（人工知能）を活用するには「膨大なデータ」が必要である

AIは大量のデータをもとにして、似ている情報を見つけ出します

データが多ければ多いほど、機械は賢くなります

例えばAさんとBさんがいたとして、この２人が知り合いであるかどうかを判断するには、どうすればよいでしょうか

たとえばAさんは現在、名古屋に住んでいて、Bさんは東京に住んでいるというデータがあれば、それだけで「知り合いの確率は低そう」とわかりますよね

しかし確率は０とは断定できません。たまたまAさんが名古屋に仕事で出向中なだけかもしれませんし、結婚して名古屋に引っ越したのかもしれません

次にAさんの年齢が25歳、Bさんの年齢が25歳というデータを与えます

するとAさんとBさんは年齢が近いということを機械は理解できます

ただ、年齢が同じでも、生まれ年は１歳違いかもしれませんよね

次にAさんの出身地は東京、Bさんの出身地は東京というデータを与えます

現在Aさんが住んでいるのは名古屋ですが、元々は東京生まれということを機械は理解します

そしてAさんとBさんが知り合いである確率は上がります

さらにAさんは「東京高校の佐藤先生を知っている」、Bさんは「東京高校の西田先生を知っている」というデータを与えます

このデータをもとにして、AさんとBさんは同じ高校出身であることを機械は理解します

同じクラスかどうかまではわかりませんが、少なくとも同じ高校に投稿していた時期は被っているのです

AさんとBさんが知り合いである可能性は一気に高まります

このように、機械はデータを与えれば与えるほど賢くなります

ここまでデータを機械に与えた後で、新しくCさんという人が登場したとします

ここで機械にCさんが「東京高校に通っていた」「２５歳である」というデータさえあれば、機械は過去のデータをもとにして、「CさんはAさん、Bさんと知り合いかもしれない」という情報を見つけます

すごくざっくり言えば、「AIとは大量の学習データをもとにして、似ている情報同士をくっつけて、法則を見つけ出す」ことができる仕組みのことです

Facebookやlineで、なぜ「知り合いかも」ができるのか、少しでも興味を持ってもらえれば、AIに少しでも興味が出てくるのではと思います

このように大量のデータを機械に覚えさせる仕組みを使えば、AIを使って将棋やチェスの勝利のパターンを機械に理解させて、人間の脳では到底記憶しておけない一手の積み重ねと、失敗しない一手のおかげで、プロでもAIに太刀打ちできなくなるのです

AIの弱点は「データが少ない」ことである

実はAIは最近のブームなのではなく、ブーム自体は３回目だそうです

過去にもAIが時代を作るといわれた時代が２度ありながらも、沈静化してしまったのは「公開されたデータが少ないこと」でした

例えば天気予報であれば、過去数十年分のデータを解析して、明日の天気を予測できるかもしれません

※人工衛星があるので、その必要性は薄いですが

しかし、たとえば将来のSNSの利用者の傾向をAIで調べようとすると、そもそもSNS自体が普及してからほんの数年程度ですから、データ量が少ないのです

AIで将棋やチェスが最強なのは、過去の膨大な勝利パターンを暗記できるからです

勝利パターンだけでなく、負けるパターンを学習させて、その一手を打たせないという方法もあります

AIのオセロも強いです

しかしAIの麻雀は２０１８年現在、まだそこまで強くはありません

２人で対戦するものとは異なり、麻雀の場合は４人対戦かつ、配牌が複数種類あり、すべての勝利パターンを予測できないからです

麻雀の場合は、ど素人であっても運さえ良ければプロに勝つこともあります

ゲームのルールが複雑になればなるほど、AIでは圧倒的な過去データが必要になるのです

AIは「正しいデータ」か「不正なデータ」か理解できない

さらに、AIは機械ですから、人間が「正しいデータ」か「不正なデータ」か、最初に教えてあげる必要があります

いくらデータが膨大に存在しても、元のデータが不正であれば、機械は誤った回答を出してしまいます

そのため、結局は人間によって機械に「正しいデータ」を教えてあげる必要があります

つまり、もとになるデータが本当に正しいものなのか判定する手段がないと、AIに教えることができないのです

AIが「ネコ」の画像を「ネコ」と認識できるには、どんな情報が必要？

人間は、道端で野良ネコを見たら「ネコ」と認識できます

絵に描かれた「ねこ」のようなものであっても「ネコ」と認識できます

一方で機械が「ネコ」という概念を理解するには、どうしたら良いのでしょうか

機械は、写真のデータを与えて、その形を理解しているわけではありません

例えば「０」という数字はこれですよ、ということを、初めに機械に覚えこませないといけないのです

つまり「ネコ」の画像データを、機械が「ネコ」と認識するためには、圧倒的な量の学習データが必要です

猫の写真に描かれている「耳」「ひげ」「輪郭」「つり目具合」を、それぞれ機械に覚えさせる必要があるからです

そのためには膨大なデータが必要です

そして、データを機械に覚えこませるためには、長時間機械を稼働させるだけのマシンやらサーバーやらが必要です

到底、普通の企業で「ネコ」を認識できるAIを導入するには、コストと時間がかかりすぎるのです

ただし、一度学習した機械は、次回から瞬時に「ネコ」か「ネコではない」かの答えを出してくれるようになります

このように学習した機械が、一般公開されるようになれば、一般企業などでも画像認識できるレベルのAIが普及するでしょう

しかし、人間が簡単にできる「ネコ」を認識するという行為をAIにやらせるには、とてつもない労力やコストがかかっているということです

まとめ。AIは発展途上であるが、年々学習して賢くなっている

AIにはまだまだ課題が多くあるといいつつ、飛躍的に年々賢くなっていきます

それは、膨大なデータが年々発生していき、その大量のデータを機械は年々覚えて学習する仕組みが存在するからです

この機械自身が、データを学習する仕組みをディープラーニングと言います

今回は長くなるので、AIのさわりだけを独断と偏見でブログ記事にして見ました

多々、謝りなども含まれれると思いますが、ご興味のある方はAIの本を一冊読んでみると、AIという存在が身近になります

こちらの本は複雑な計算式はゼロですが、AIの歴史や仕組みについて学べる良書です。ぜひ一読して見てください。

人工知能は人間を超えるかディープラーニングの先にあるもの (角川EPUB選書)

posted with カエレバ

松尾豊 KADOKAWA/中経出版 2015-03-11