先日、子供つながりで知り合った数家族が、我が家に遊びに来たんですよ。それで、教育熱心なママ達が我が家のリビングでこんな事を言っていたわけです。
「もうあと何年かしたら、人間の仕事がほとんどAIに奪われちゃうんでしょ?」
「この子達が大人になったらどうしたら良いのかしら」
もうね、アホかと。馬鹿かと。
お前らな、Pythonで機械学習してるぐらいで、シンギュラリティとか言ってるんじゃねーよ、ボケが
と吉野家コピペが始めてしまいそうなところでしたが、妻の鋭い視線を感じとって、「ですよねー、子供達にどんな教育してったら良いのか悩みますよねー」と方針を切り替えて、無事に軟着陸をしました。ナイス、俺。
今回は、様々な情報が錯綜している昨今のAIブームについて、その概観をご紹介しつつ、AIの可能性と限界について語って参ります。
AIの歴史
歴史的に見ると、AIブームは今回が初めてではなく3回目です。第1次AIブームは1960年代、第2次AIブームは1980年代に起こりました。
ブームが起こると、AIが何でも解決できるのではないか!?という期待が沸き起こりましたが、やがて技術的な限界が明らかとなり、失望とともに期待は潰えてブームは下火となって、冬の時代に突入してきたというのがこれまでのAIの歴史です。
ペッパー君さようなら 8割超が“もう要らない(AERA.dot)
1つだけ顔上げてるの調べると全員コッチ向く系のイベント処理入ってそうで怖い pic.twitter.com/P0iNbYzY1U
— なぎさ 11/4ユーカリ模型展示会行きます (@oshimanagisa) 2018年6月1日
AIにできること
AIというか機械学習ですけど、何ができるかって別に大した話ではありません。
機能 | 内容 | 補足説明 |
---|---|---|
分類 | 与えられたデータが、何のクラスに属しているかを予測する | この画像は猫だ |
回帰 | 今あるデータの連続性を使って、未知のデータを予測する | 1日50g減量できてるから、1ヶ月後は1.5kgダイエットできてるはず |
推薦 | いま閲覧しているアイテムに類似しているアイテムを提示する | この商品を買った人はこれも買っています |
異常検知 |
通常と異なるデータの外れ値を検知する | どうしたの、コナンくん? 妙だな、やけに今日は旦那が優しい…。 |
頻出 パターン |
データ中に高頻度に出現するパターンを抽出する | おむつを買った人はビールを買う傾向がある(ほぼ都市伝説) |
強化学習 | 大量の試行錯誤から学習し、最適な行動の方針を獲得する | アルファ碁など |
現時点ではAIの要素技術は統計学に基づいていているので、そもそもAIに100%の正解を期待してはNGで、人間をサポートする位置づけ以上にはなれないでしょう。
AIにまつわる誤解
ママさん達と話をしていると
「AIは膨大な量の過去データをぜんぶ学習してパターン化する」
「さらに、今後も学習し続けるからAIは万能」
という様に捉えているようなんです。なるほど…。でも私は、そこに大きな誤解があると感じます。
過去にどれだけのパターンが出現したのか
まず、最初に疑義を持つのは「過去データのパターンは全体の何%をカバーできているのか」ということです。
取りうるパターンが1000兆パターンあったとして、過去に出現したパターンが100パターンだったとしたら、残りの999兆9999億9999万9900パターンには対応できないわけですよ。
なので漠然と「過去のデータにパターンが出尽くしている」と考えるのが、まずおこがましい。
過去のデータで未来が予測できる問題なのか
それで、そもそも過去のデータで法則性が見つけられたり、パターン化できる問題なんていうのは非常に単純な問題で、AIなんていうもっと昔から既に分析されていてビジネスに活用されています。
世の中の複雑な問題は、パターンが見つけづらい非線形の問題です。過去のデータにパターンを見つけた!と思っても、未来のデータに適用しようとすると、いきなりパターンが崩れてしまいます。
競馬の予想でも、株価予想でもそうです。過去のデータを分析すれば、何かしらの法則性っぽいものが見つけられるかもしれませんが、そのパターンで未来をピタリと的中させることはできません。
そもそも「法則性がある」という考えが幻想なのかもしれません。
- どんなに膨大な過去データを学習しようと
- どんなに最新のコンピューターパワーを使用しようと
サイコロの目を当てるのに、確率1/6を有意に上回ることはできないでしょう。
データの質と量
自分で手を動かしてデータ分析したことがあればすぐに分かるんですけど、そもそも「いろんな種類のデータが膨大にあれば」良いってわけじゃありません。
ゴミデータはいくら分析したってゴミな結果しか出てこないし、結果出た!と思ったら「薄毛の人はハゲやすい事が分かりました」みたいに、そんなの分析する前から知ってたみたいな結果とかね。
データ分析の世界は「まぜるな危険」なんです。
絵の具をですね、いろんな色をどんどん混ぜていくと最終的に黒になるじゃないですか。
でもですよ。真っ黒に塗られたキャンバスを出されて「ここに名画が描かれているかもしれないから、その名画を抽出して」って言われても無茶なんですよ。世の中のデータサイエンティストとか呼ばれている人たちが実際に直面してるのって、そんな感じのクリエイティブです。
今後AIが活躍していくと思われる分野
すみません愚痴っぽくなってしまいましたが、私も分野によってはAIが爆発的に活躍していくであろうと考えています。その中でも
「画像・映像解析」「音声解析」のジャンルは、AIとの相性が優れていると感じています。
- 画像、映像、音声はデータとしてデジタル化がしやすい
- まだデータ化されていない、または人手の関係で分析されていないデータが多くある
- 人間が正解を判別できる
といった理由ですね。
具体的には、医療における放射線読影医とか、防犯カメラ映像の分析とか、音声から感情を分析する仕事などが挙げられます。
現状、映像や音声を専門家が職人技で分析している仕事は、残念ながら根こそぎAIに取って代わられていくんじゃないでしょうか。
AIが苦手なこと
一方で、現在のAIは自然言語の取り扱いはまだまだだと感じています。所詮は形態素解析なので、テキストを読み込んで、単語をぶつ切りにし、出現頻度と出現場所を統計的に処理するぐらいしかできない。
言語で最も大事な「文意を読み取る」「文脈を作る」という事ができません。そもそも、どうアプローチしていったらいいかという指針すら立てられていないと思います。
東ロボくんの限界
「ロボットは東大に入れるか」というテーマで、国立情報学研究所が進めていた「東ロボくん」というプロジェクトがありました。
2011年から始まった東ロボくんプロジェクトは、センター試験総合模試で5教科で偏差値57.1を叩き出すも、そこで成績が伸び悩み、東大受験突破は無理と判断され、プロジェクトは凍結されることになりました。
「東ロボくん」が偏差値57で東大受験を諦めた理由(ダイヤモンド・オンライン)
東ロボくんは、単語の穴埋め問題などの暗記問題は得意なのですが、いかんせん国語も英語も長文読解になると対応できません。だって、ベースの技術は形態素解析なので、文脈は理解してないんだもの…。
◆東大合格をいったんあきらめたのはなぜ?
現在の研究では、偏差値70以上必要な東大合格は難しい、という判断がありました。理由はまず、苦手分野が克服できないこと。国語や英語の特に長文問題は非常に苦手です。
そして、その原因でもありますが、「読解力」が無い、という問題が指摘されています。国語や英語に限らず他の科目でも文章題は苦手な傾向がありますが、それは要するに問題文をちゃんと読み解いて意味を理解することができないからではないかとされます。
(画像出典:NHK解説アーカイブス)
こちらは模試の英語で、大半の受験生は正解したのに東ロボくんができなかった問題です。AさんとBさんが本屋まで歩いてようやく着きそうになったとき、Bさんが何か言います。それに対してAさんが「ありがとう」と答えるのですが、ではBさんはなんと言ってたのか?という4択です。どれだと思いますか?
◆「ありがとう」とお礼を言ってるから、「靴ひもがほどけているよ」と教えてくれたのでは?
正解です。でも、東ロボくんは「長いこと歩いたよ」というのを選んでしまいました。おそらく膨大な文章データを検索すると、歩く時間を書いた文の前後には「長い時間」といった表現が来ることが多いのではないかと考えられます。
つまり、東ロボくんには「人間がどんな状況でお礼を言うか」という常識が無いですし、「Aさんが、Bさんの言ったことに対して感謝している」という意味が理解できていないため、こういう問題は解けないわけです。
東ロボくんは単語の意味や1つの短い文の翻訳などはすごく優秀ですが、複数の文からなる文章や会話になると、もっと常識とか経験に基づいた行間を読む力といった人間ならではの力が必要なようで、これはAIが本質的に抱えている弱点かもしれません。
上記では「常識とか経験に基づいた行間を読む力」と言ってますが、人間の使っている自然言語というのは、実際に飛び交っている言葉だけでなく、お互いが持っている膨大な量のデータベースの情報を使いながらコミュニケーションを行っています。
「男の人が花を持っていた」という文章があったとして
- プロポーズ?母の日?お墓参り?
- 若い人?中年?老人?
- 朝?昼?夜?
みたいな感じで、人間は無意識のうちに文章には書いていない、バックグラウンドの情報と引き当てながら読み進んでいくわけです。
そのバックグランドの情報があまりに膨大であり、それをどのように活用しているかがうまく解明できていないため、データもロジックをAIに組み込めていないし、今後もその見通しがまったく立っていないというのが実情だと思います。
ハリー・ポッターと巨大な灰の山らしきものの肖像
Botnik Studiosというクリエイティブ集団が、ハリー・ポッターシリーズ全7巻をすべて学習させたAIに、新作を書かせたという話題もありました。
AIがハリポタ全巻読破して新作を書いたらカオス過ぎた件について 「ハーマイオニーの家族を食べるロン」「七ヶ月間、階段から落ち続けるハリー」など(Togetter)
だからAIに駆逐されずに生き残れるスキルは
AIが苦手としている文脈(コンテクスト)や物語(ストーリーテリング)を中心に据えた
- プレゼンテーション
- ファシリテーション
- ネゴシエーション
- ドキュメンテーション
などのコミュニケーションスキルを要求される仕事は、今後もまだまだAIには駆逐されずに生き残ると思います。
投資用マンションを押し売りするツーブロックゴリラ、あまりのクセの強さに会社が特定されるも既に廃業 https://t.co/142DkLhLGE
— 全力2階建 (@kabumatome) 2017年9月30日
モザイクかけてもわかるツーブロック、スーパーサイヤ人になる時のゴリラ感、テーブルに腰掛け恫喝する姿。完璧だろこのお方。 pic.twitter.com/3snwf4uAXg
— かずお君 (@kazuo57) 2017年9月27日
みなさんも一緒に頑張ってスキルを磨いて行きましょう!
あくのさんの平身低頭土下座スタイルと蝶野のお客さんの前で断定する自信満々ぶりを完コピして営業してたら紹介と案件の相談がマジでめちゃくちゃ増えてるw
— 札束くん (@fudousanyatan) 2018年7月11日