AI(人工知能)の学習を1週間だけする機会に恵まれました
書店にいくと、数々のAIの本が売られていますが、実生活ではまだまだAIが浸透したことを実感していない方が多いのではないでしょうか
実はすでにいたるところでAIの技術は使われていて、今後はさらに「AIを使ったシステムや商品はあたりまえ」になる未来がくるかもしれません
とはいえ、たったの1週間ですがAIについて学んだ中で、勉強前と後でギャップがありました
今回は「AIってなに?」という方向けに、知識0からAIについて学んでわかったことをまとめてみました
AI(人工知能)の学習を1週間してわかったことやメリット、デメリットは?
AIとは一体なんなのか?
AIというのは非常に曖昧な言葉です
人工知能(じんこうちのう、英: artificial intelligence、AI)とは、「「計算(computation)」という概念と「コンピュータ(computer)」という道具を用いて「知能」を研究する計算機科学(computer science)の一分野」を指す語。
出典: フリー百科事典『ウィキペディア(Wikipedia)』
機械学習などであればもう少しわかりやすいのですが、 AIは実に定義が難しいのです
なので、AIは非常に話題にはなっていますが、実際になんなのかは、実はわからなくて当然だったりします
AIとは、人間の知的営みをコンピュータに行わせるための技術のこと、または人間の知的営みを行うことができるコンピュータプログラムのことである。一般に「人工知能」と和訳される。
なのでAIの定義は辞書によって異なります
すっごく大雑把に言えば、「機械が人間のように考えられるようなプログラムを作ること」と言えます
がっつりと定義されていないからこそ、「AIってなに?」と聞かれても難しいわけですね
AI(人工知能)を活用するには「膨大なデータ」が必要である
AIは大量のデータをもとにして、似ている情報を見つけ出します
データが多ければ多いほど、機械は賢くなります
例えばAさんとBさんがいたとして、この2人が知り合いであるかどうかを判断するには、どうすればよいでしょうか
たとえばAさんは現在、名古屋に住んでいて、Bさんは東京に住んでいるというデータがあれば、それだけで「知り合いの確率は低そう」とわかりますよね
しかし確率は0とは断定できません。たまたまAさんが名古屋に仕事で出向中なだけかもしれませんし、結婚して名古屋に引っ越したのかもしれません
次にAさんの年齢が25歳、Bさんの年齢が25歳というデータを与えます
するとAさんとBさんは年齢が近いということを機械は理解できます
ただ、年齢が同じでも、生まれ年は1歳違いかもしれませんよね
次にAさんの出身地は東京、Bさんの出身地は東京というデータを与えます
現在Aさんが住んでいるのは名古屋ですが、元々は東京生まれということを機械は理解します
そしてAさんとBさんが知り合いである確率は上がります
さらにAさんは「東京高校の佐藤先生を知っている」、Bさんは「東京高校の西田先生を知っている」というデータを与えます
このデータをもとにして、AさんとBさんは同じ高校出身であることを機械は理解します
同じクラスかどうかまではわかりませんが、少なくとも同じ高校に投稿していた時期は被っているのです
AさんとBさんが知り合いである可能性は一気に高まります
このように、機械はデータを与えれば与えるほど賢くなります
ここまでデータを機械に与えた後で、新しくCさんという人が登場したとします
ここで機械にCさんが「東京高校に通っていた」「25歳である」というデータさえあれば、機械は過去のデータをもとにして、「CさんはAさん、Bさんと知り合いかもしれない」という情報を見つけます
すごくざっくり言えば、「AIとは大量の学習データをもとにして、似ている情報同士をくっつけて、法則を見つけ出す」ことができる仕組みのことです
Facebookやlineで、なぜ「知り合いかも」ができるのか、少しでも興味を持ってもらえれば、AIに少しでも興味が出てくるのではと思います
このように大量のデータを機械に覚えさせる仕組みを使えば、AIを使って将棋やチェスの勝利のパターンを機械に理解させて、人間の脳では到底記憶しておけない一手の積み重ねと、失敗しない一手のおかげで、プロでもAIに太刀打ちできなくなるのです
AIの弱点は「データが少ない」ことである
実はAIは最近のブームなのではなく、ブーム自体は3回目だそうです
過去にもAIが時代を作るといわれた時代が2度ありながらも、沈静化してしまったのは「公開されたデータが少ないこと」でした
例えば天気予報であれば、過去数十年分のデータを解析して、明日の天気を予測できるかもしれません
※人工衛星があるので、その必要性は薄いですが
しかし、たとえば将来のSNSの利用者の傾向をAIで調べようとすると、そもそもSNS自体が普及してからほんの数年程度ですから、データ量が少ないのです
AIで将棋やチェスが最強なのは、過去の膨大な勝利パターンを暗記できるからです
勝利パターンだけでなく、負けるパターンを学習させて、その一手を打たせないという方法もあります
AIのオセロも強いです
しかしAIの麻雀は2018年現在、まだそこまで強くはありません
2人で対戦するものとは異なり、麻雀の場合は4人対戦かつ、配牌が複数種類あり、すべての勝利パターンを予測できないからです
麻雀の場合は、ど素人であっても運さえ良ければプロに勝つこともあります
ゲームのルールが複雑になればなるほど、AIでは圧倒的な過去データが必要になるのです
AIは「正しいデータ」か「不正なデータ」か理解できない
さらに、AIは機械ですから、人間が「正しいデータ」か「不正なデータ」か、最初に教えてあげる必要があります
いくらデータが膨大に存在しても、元のデータが不正であれば、機械は誤った回答を出してしまいます
そのため、結局は人間によって機械に「正しいデータ」を教えてあげる必要があります
つまり、もとになるデータが本当に正しいものなのか判定する手段がないと、AIに教えることができないのです
AIが「ネコ」の画像を「ネコ」と認識できるには、どんな情報が必要?
人間は、道端で野良ネコを見たら「ネコ」と認識できます
絵に描かれた「ねこ」のようなものであっても「ネコ」と認識できます
一方で機械が「ネコ」という概念を理解するには、どうしたら良いのでしょうか
機械は、写真のデータを与えて、その形を理解しているわけではありません
例えば「0」という数字はこれですよ、ということを、初めに機械に覚えこませないといけないのです
つまり「ネコ」の画像データを、機械が「ネコ」と認識するためには、圧倒的な量の学習データが必要です
猫の写真に描かれている「耳」「ひげ」「輪郭」「つり目具合」を、それぞれ機械に覚えさせる必要があるからです
そのためには膨大なデータが必要です
そして、データを機械に覚えこませるためには、長時間機械を稼働させるだけのマシンやらサーバーやらが必要です
到底、普通の企業で「ネコ」を認識できるAIを導入するには、コストと時間がかかりすぎるのです
ただし、一度学習した機械は、次回から瞬時に「ネコ」か「ネコではない」かの答えを出してくれるようになります
このように学習した機械が、一般公開されるようになれば、一般企業などでも画像認識できるレベルのAIが普及するでしょう
しかし、人間が簡単にできる「ネコ」を認識するという行為をAIにやらせるには、とてつもない労力やコストがかかっているということです
まとめ。AIは発展途上であるが、年々学習して賢くなっている
AIにはまだまだ課題が多くあるといいつつ、飛躍的に年々賢くなっていきます
それは、膨大なデータが年々発生していき、その大量のデータを機械は年々覚えて学習する仕組みが存在するからです
この機械自身が、データを学習する仕組みをディープラーニングと言います
今回は長くなるので、AIのさわりだけを独断と偏見でブログ記事にして見ました
多々、謝りなども含まれれると思いますが、ご興味のある方はAIの本を一冊読んでみると、AIという存在が身近になります
こちらの本は複雑な計算式はゼロですが、AIの歴史や仕組みについて学べる良書です。ぜひ一読して見てください。