シンプル都心ライフ

都内で働くITエンジニアの都心ライフ。主要キーワード:大学院/TOEIC/就活/都心ライフ/ホテル/SPG/米国株投資/副業

AI(人工知能)の学習を1週間してわかったことやメリット、デメリットは?

f:id:steveperry1373:20181002222233j:image

AI(人工知能)の学習を1週間だけする機会に恵まれました

 

書店にいくと、数々のAIの本が売られていますが、実生活ではまだまだAIが浸透したことを実感していない方が多いのではないでしょうか

 

実はすでにいたるところでAIの技術は使われていて、今後はさらに「AIを使ったシステムや商品はあたりまえ」になる未来がくるかもしれません

 

とはいえ、たったの1週間ですがAIについて学んだ中で、勉強前と後でギャップがありました

 

今回は「AIってなに?」という方向けに、知識0からAIについて学んでわかったことをまとめてみました

 

 

 

 

 

AI(人工知能)の学習を1週間してわかったことやメリット、デメリットは?

AIとは一体なんなのか?

AIというのは非常に曖昧な言葉です

 

人工知能(じんこうちのう、: artificial intelligence、AI)とは、「「計算(computation)」という概念と「コンピュータ(computer)」という道具を用いて「知能」を研究する計算機科学(computer science)の一分野」を指す語。

出典: フリー百科事典『ウィキペディア(Wikipedia)』

 

機械学習などであればもう少しわかりやすいのですが、 AIは実に定義が難しいのです

 

なので、AIは非常に話題にはなっていますが、実際になんなのかは、実はわからなくて当然だったりします

 

AIとは、人間知的営みコンピュータに行わせるための技術のこと、または人間知的営みを行うことができるコンピュータプログラムのことである。一般に人工知能」と和訳される。

 

 なのでAIの定義は辞書によって異なります

 

すっごく大雑把に言えば、「機械が人間のように考えられるようなプログラムを作ること」と言えます

 

がっつりと定義されていないからこそ、「AIってなに?」と聞かれても難しいわけですね

 

AI(人工知能)を活用するには「膨大なデータ」が必要である

AIは大量のデータをもとにして、似ている情報を見つけ出します

 

データが多ければ多いほど、機械は賢くなります

 

例えばAさんとBさんがいたとして、この2人が知り合いであるかどうかを判断するには、どうすればよいでしょうか

 

たとえばAさんは現在、名古屋に住んでいて、Bさんは東京に住んでいるというデータがあれば、それだけで「知り合いの確率は低そう」とわかりますよね

 

しかし確率は0とは断定できません。たまたまAさんが名古屋に仕事で出向中なだけかもしれませんし、結婚して名古屋に引っ越したのかもしれません

 

次にAさんの年齢が25歳、Bさんの年齢が25歳というデータを与えます

 

するとAさんとBさんは年齢が近いということを機械は理解できます

 

ただ、年齢が同じでも、生まれ年は1歳違いかもしれませんよね

 

次にAさんの出身地は東京、Bさんの出身地は東京というデータを与えます

 

現在Aさんが住んでいるのは名古屋ですが、元々は東京生まれということを機械は理解します

 

そしてAさんとBさんが知り合いである確率は上がります

 

さらにAさんは「東京高校の佐藤先生を知っている」、Bさんは「東京高校の西田先生を知っている」というデータを与えます

 

このデータをもとにして、AさんとBさんは同じ高校出身であることを機械は理解します

 

同じクラスかどうかまではわかりませんが、少なくとも同じ高校に投稿していた時期は被っているのです

 

AさんとBさんが知り合いである可能性は一気に高まります

 

このように、機械はデータを与えれば与えるほど賢くなります

 

ここまでデータを機械に与えた後で、新しくCさんという人が登場したとします

 

ここで機械にCさんが「東京高校に通っていた」「25歳である」というデータさえあれば、機械は過去のデータをもとにして、「CさんはAさん、Bさんと知り合いかもしれない」という情報を見つけます

 

すごくざっくり言えば、「AIとは大量の学習データをもとにして、似ている情報同士をくっつけて、法則を見つけ出す」ことができる仕組みのことです

 

Facebookやlineで、なぜ「知り合いかも」ができるのか、少しでも興味を持ってもらえれば、AIに少しでも興味が出てくるのではと思います

 

このように大量のデータを機械に覚えさせる仕組みを使えば、AIを使って将棋やチェスの勝利のパターンを機械に理解させて、人間の脳では到底記憶しておけない一手の積み重ねと、失敗しない一手のおかげで、プロでもAIに太刀打ちできなくなるのです

 

AIの弱点は「データが少ない」ことである

実はAIは最近のブームなのではなく、ブーム自体は3回目だそうです

 

過去にもAIが時代を作るといわれた時代が2度ありながらも、沈静化してしまったのは「公開されたデータが少ないこと」でした

 

例えば天気予報であれば、過去数十年分のデータを解析して、明日の天気を予測できるかもしれません

※人工衛星があるので、その必要性は薄いですが

 

しかし、たとえば将来のSNSの利用者の傾向をAIで調べようとすると、そもそもSNS自体が普及してからほんの数年程度ですから、データ量が少ないのです

 

AIで将棋やチェスが最強なのは、過去の膨大な勝利パターンを暗記できるからです

 

勝利パターンだけでなく、負けるパターンを学習させて、その一手を打たせないという方法もあります

 

AIのオセロも強いです

 

しかしAIの麻雀は2018年現在、まだそこまで強くはありません

 

2人で対戦するものとは異なり、麻雀の場合は4人対戦かつ、配牌が複数種類あり、すべての勝利パターンを予測できないからです

 

麻雀の場合は、ど素人であっても運さえ良ければプロに勝つこともあります

 

ゲームのルールが複雑になればなるほど、AIでは圧倒的な過去データが必要になるのです

AIは「正しいデータ」か「不正なデータ」か理解できない

さらに、AIは機械ですから、人間が「正しいデータ」か「不正なデータ」か、最初に教えてあげる必要があります

 

いくらデータが膨大に存在しても、元のデータが不正であれば、機械は誤った回答を出してしまいます

 

そのため、結局は人間によって機械に「正しいデータ」を教えてあげる必要があります

 

つまり、もとになるデータが本当に正しいものなのか判定する手段がないと、AIに教えることができないのです

 

 

 

AIが「ネコ」の画像を「ネコ」と認識できるには、どんな情報が必要?

人間は、道端で野良ネコを見たら「ネコ」と認識できます

 

絵に描かれた「ねこ」のようなものであっても「ネコ」と認識できます

 

一方で機械が「ネコ」という概念を理解するには、どうしたら良いのでしょうか

 

機械は、写真のデータを与えて、その形を理解しているわけではありません

 

例えば「0」という数字はこれですよ、ということを、初めに機械に覚えこませないといけないのです

 

つまり「ネコ」の画像データを、機械が「ネコ」と認識するためには、圧倒的な量の学習データが必要です

 

猫の写真に描かれている「耳」「ひげ」「輪郭」「つり目具合」を、それぞれ機械に覚えさせる必要があるからです

 

そのためには膨大なデータが必要です

 

そして、データを機械に覚えこませるためには、長時間機械を稼働させるだけのマシンやらサーバーやらが必要です

 

到底、普通の企業で「ネコ」を認識できるAIを導入するには、コストと時間がかかりすぎるのです

 

ただし、一度学習した機械は、次回から瞬時に「ネコ」か「ネコではない」かの答えを出してくれるようになります

 

このように学習した機械が、一般公開されるようになれば、一般企業などでも画像認識できるレベルのAIが普及するでしょう

 

しかし、人間が簡単にできる「ネコ」を認識するという行為をAIにやらせるには、とてつもない労力やコストがかかっているということです

 

まとめ。AIは発展途上であるが、年々学習して賢くなっている

AIにはまだまだ課題が多くあるといいつつ、飛躍的に年々賢くなっていきます

 

それは、膨大なデータが年々発生していき、その大量のデータを機械は年々覚えて学習する仕組みが存在するからです

 

この機械自身が、データを学習する仕組みをディープラーニングと言います

 

今回は長くなるので、AIのさわりだけを独断と偏見でブログ記事にして見ました

 

多々、謝りなども含まれれると思いますが、ご興味のある方はAIの本を一冊読んでみると、AIという存在が身近になります

 

こちらの本は複雑な計算式はゼロですが、AIの歴史や仕組みについて学べる良書です。ぜひ一読して見てください。