読書メモ:「文系AI人材になる」を読んだ

AI、機械学習に関連した基礎知識をつけたいなぁという思いから、文系 AI 人材になるを読みました。本書のタイトルにある「文系 AI 人材」になるつもりは今のところありませんが、要点が抑えられそう、専門的な話を抜きにして全体を俯瞰するのにちょうどよさそう、ということで本書を選定してみました。

以下、読書メモ。

第 1 章 AI 社会で職を失わないために

「AI 失職」を恐れず「AI 職」に就く準備を

AI によって無くなる仕事を受け入れつつ、新しい時代に合わせた職種に順応していくのがよい
- これまでの社会でも、車業務の普及により馬車乗りが仕事を失い、運転手や車販売の仕事が生まれたきた。という例えはわかりやすかった
IT 関連職、という枠組みの中に多くの職種が存在するように、AI 関連職もバラエティに富んだものになっていくだろう

｢AI との共働き｣スキルを身につけよう

日本の労働者の内、22％が「AI が私の仕事にポジティブな影響をもたらす」と回答したとする調査結果がある
- 世界平均が 62％なので、日本人は他国と比較して AI へ不安を感じる割合が大きい
- 僕自身の身の回り、ないし仕事においてはポジティブな結果をもたらしてくれると感じている（労働からの開放をはょ…）
AI を知ることが、AI に対する不安への対処
- 未知への恐怖はありますよね、学んでいきたい
AI との共働き
- AI は完全なものではない
- AI の不完全さを理解して、補うことが必要
- ポイントは「AI にどれくらいの割合の業務を渡すのか？」の視点
- AI へ仕事を任せる比率を決めるのは人間側、共働きを最適なものにするための人間の大きな役目となる
- そのためにも AI と人間の得意、不得意を認識することが必要

5 つの「共働きスタイル」

AI との分業バランスは以下の 5 つに分類可能（図は省略）
- ① 人だけで仕事をする「一型」
  - AI の介在がなく人だけで業務を行なっている状態
  - 業務：管理業務、クリエイティブ業務
- ② 人の仕事を AI が補助する「T 型」
  - AI によって一部の業務だけが代行される。業務遂行のメインは人
  - 業務：接客業務、営業業務、教育業務、企画・執筆業務、ソーシャルワーク業務
  - 人が AI について知識をもっているかで業務効率化が変わる（得意、不得意への理解）
    - e.g.) 店舗に導入した接客用ディスプレイで購入履歴からレコメンドすることは可能。しかし、店員の意見を聞きたかったり会話を楽しんだりしながら買うものを決めたいユーザには AI は向かない
- ③ 人の仕事を AI が拡張する「O 型」
  - AI によって人の業務を拡張する。これまで人ができなかったレベルの業務を可能にする
  - 業務：高度な専門業務、予測分析業務
    - 高度な専門業務というと幅広いが、本書では医療業務、弁護士業務が紹介されている
  - 業務、業界のドメイン知識と AI の基礎知識を掛け合わせることで、業務改革が果たされる
- ④ AI の仕事を人が補助する「逆 T 型」
  - AI に多くの業務が代行されるが、一部人によって補助する。人によって前準備が必要な状態もしくは不完全な部分が残るためチェックと仕上げを人が行う状態
  - 業務：データ入力業務、電話応答業務、運転業務、運搬業務
- ⑤ 人のしごとを AI が完全に代行する「I 型」
  - AI によって業務のほぼすべてが担われている状態
  - 業務：注文・会計業務、監視業務
  - このパターンに該当する職種は AI によってなくなる仕事になる可能性がある（人の価値 < AI の価値になる）
自分でも何か AI を作ろう、活用しようと考えた際にどの分類として、どう活用すべきかが簡潔にまとまっていて良い

第 2 章文系のための AI キャリア

AI は「作る」から「使う」へ

これまでの AI 人材教育は AI を作ることにフォーカスされていた
- e.g.) プログラム、MLOps、AI の精度向上の手法、データ処理
AI エンジニア、データサイエンティストなど、AI を作る立場にあるキャリアは以前と比較すると格段に増えた
一方で AI を使う側の教育環境、キャリアはまだまだ充実するべき
- 僕自身、AI の活用事例や「やってみた」のような記事は情報が得やすいと感じるが、いざ AI を使いたいと考えている場合に、どのように学習を進めるべきかは迷った。その点、本書は僕にとって有益だと感じる
AI はカジュアルに作れるようになってきた
- 経験者の増加や、AI 構築環境の発展など
スクラッチで AI を作る代わりの選択肢
- コードベースの AI 構築環境
  - Amazon SageMaker
  - Google Ai Platform
  - Azure Machine Learning
  - Watson Machine Learning
- GUI ベースの AI 構築環境
  - Google Cloud AutoML
  - DataRobot
  - Sony Prediction One
  - MAGELLAN BLOCKS
  - ABEJA Platform
- 構築済み AI サービスの利用
  - Google の AI サービス
  - Amazon の AI サービス
  - LINE BRAIN
  - Azure Cognitive Services
  - Watson API

上手に活用する「文系 AI 人材」が重要に

AI を作る or 使う？
- 構築済み AI サービスは、簡単で導入まで早い
- カスタマイズ性が他のものと比較すると低い
- 選択肢が広がってきたことで、利用用途に応じた適切な判断が重要になってきた
AI をうまく使う
- 「AI を作ることが目的」になってしまったケースは NG
- ビジネス価値を最大化させるためには、ビジネスそのものと業務知識が重要
- AI をうまく使う人材が AI 活用の現場で価値となってきている

「文系 AI 人材」の仕事内容とは？

AI 企画
- 5W1H を徹底する
  - WHO：誰のための AI？
  - WHY：なぜ AI が必要？
  - WHICH：どのタイプの AI？
  - WHAT：どんな AI？
  - HOW：どう分業する？
  - WHEN：いつまでに用意する？
- 導入、利用・管理
  - 業務プロセスの詳細を加味した導入計画を立てる
  - 導入後の継続利用と、どのように利用するかを管理
業種ごとの AI エキスパートが誕生するだろう
- e.g.) EC・IT の AI エキスパート、車・交通の AI エキスパート

「文系 AI 人材」になるための 4 つのステップ

文系 AI 人材になるつもりは今のところないのでスキップ。

第 3 章 AI のキホンは丸暗記で済ます

AI/機械学習/ディープラーニングの違い

AI 分類
- AI、機械学習、ディープラーニングの 3 大分類
- 学習方式の 3 分類（教師あり / 教師なし / 強化学習）
- 活用タイプ別 AI 8 分類
AI
- 人間と同様の知能を実現させようとする技術
機械学習
- AI の一種。学習により特定のタスクを実行できるようになる AI。学習は主に人が特徴を定義
ディープラーニング
- 機械学習の一種。人間の脳の神経細胞（ニューロン）を模した学習法から発展。マシンが特徴を自動で定義
AI の歴史
- AI という言葉自体は 1950 年代に登場（そんな古くからある言葉なんですね）
- 当初はゲーム、パズル、迷路のゴールを探す程度（第一次 AI ブーム）
- 1980 年代エキスパートシステム作りが目指される（第二次 AI ブーム）
- 例外処理などに対処しづらい、情報のインプットを人が行うコストがあり実用化に至らなかった（AI の冬）
- AI 自らが学習するというアプローチから機械学習が誕生（一定のデータにより機械が学習することで精度を上げる）
- 2000 年代に入るとマシンの処理速度向上、高性能化もあって実用化に兆しが
- ディープラーニングの登場で、人による特徴の定義なしに、マシンそのものが特徴づけも行い、学習を高い精度で進めていくことができるように（第三次 AI ブーム）
- 2016 年以降はビッグデータの取り組み、マシンの更なる処理速度向上、高性能化でディープラーニングの取り組みが急速に加速
- ディープラーニングは特に以下 3 点の力を向上させ、AI の可能性を広げた
  - 画像・動画識別力
  - 自然言語・会話制御力
  - 物体制御力

学習方式の 3 分類 - 教師あり/教師なし/強化学習

教師あり学習
- 学習方法：正解、不正解の答えがあるデータで学習
- タイプ：分類、回帰
教師なし学習
- 学習方法：正解、不正解の答えがないデータで学習
- タイプ：クラスタリング
強化学習
- 学習方法：連続した行動に対する報酬と罰によって学習
- メモ：
  - より良い選択を繰り返させるための学習
  - エージェントは行動を選択することで環境から報酬を得る
分類
- 選択肢に対して、どれに適応するかを予測する
- e.g.) 車の画像から該当する車メーカーを当てる、EC サイトである顧客が購入するか、しないかを当てる
回帰
- 数値を予測する
- e.g.) 車の画像から走行距離を当てる、EC サイトの来月の売り上げを予測する
クラスタリング
- AI の自己解釈による集合作り
- 何を意味するかまでは AI は返さない
- e.g.) 複数の車の画像を与える → カラーの特徴が似ている、SUV or 軽自動車

活用タイプ別 AI は 4 x 2=8 分類

機能別 4 タイプ x 役割別 2 タイプ = 活用タイプ別 AI 8 分類
機能別 4 タイプ
- 識別系 AI：見て認識する
- 予測系 AI：考えて予測する
- 会話系 AI：会話する
- 実行系 AI：身体（物体）を動かす
役割別 2 タイプ
- 代行型：人間ができることを AI が代わりに行う
  - 該当する型：T 型、逆 T 型、I 型
- 拡張型：人間ができないことを AI によってできるようにする
  - 該当する型：O 型
活用タイプ別 AI 8 分類
- 識別系 x 代行型 AI：大量情報からの自動識別
- 識別系 x 拡張型 AI：人間だと見分けられない事象発見
- 予測系 x 代行型 AI：大量ログからの異常値検出
- 予測系 x 拡張型 AI：ビッグデータからの高精度な予測
- 会話系 x 代行型 AI：対話コミュニケーションの 24h 代行
- 会話系 x 拡張型 AI：専門的対話や多言語対応
- 実行系 x 代行型 AI：人間業務全般の代行
- 実行系 x 拡張型 AI：自立型機器の作動制御

「○○ 系 AI」はこう使う

それぞれの活用タイプ別の AI に関する特徴を、具体例を交えて紹介
参考になるようなものが多いが、メモとしてはスキップ

出る順で AI 基礎用語を丸暗記する

いくらか、これまでのメモと重複するもあるためスキップしながらメモ。

学習
- AI に法則性を教えること
予測
- 作った AI モデルにより未来、未知のものを当てること
目的変数
- 予測したい値
説明変数
- 予測するための値
アルゴリズム
- 学習する際の手法。学習の手順や方法論のカタマリ
よく使われるアルゴリズム
- 機械学習 / 教師あり
  - 線形回帰：データの散らばりのルールを直線と仮定、それがどのようなものかを学習し値を予測
  - ロジスティック回帰：線形回帰とは異なり、発生確率（0-1 の値）を予測
  - サポートベクターマシーン（SVM）：マージン最大化。判別する協会の近くにあるデータ同士の距離を大きくすることで誤判別を防ぐ手法
  - 決定木：データを複数層で分岐し、ツリー構造の分岐を作る手法
  - ランダムフォレスト：決定木の集合体。複数の決定木をランダムに構築し結果を集める
- 機械学習 / 教師なし
  - クラスタリング
- ディープラーニング
  - CNN：畳み込みニューラルネットワーク。画像認識が得意
  - RNN：再起型ニューラルネットワーク。音声波形、動画、文章などの時系列データが得意
  - LSTM：Long 　 Short-Term Memory。RNN の欠点を解消し、長期の時系列データを学習できるモデル。自然言語が得意
  - GAN：Generative Adversarial Netwrork。教師用のデータを生成するモデル。類似モデルとして VAE というものがある
  - DQN：Deep Q Network。強化学習を深層学習で行なったもの
  - ResNet：残差ネットワーク。非常に深いネットワークでの高精度な学習を可能にする
過学習
- 既知のデータに過剰な最適化をしてしまい、未知のデータでうまく予測できない状態
- 対処方法として…
  - 学習データの量を増やし、偏りをなくす
  - 訓練データと検証データの分割パターンを多数試し、結果の平均をとる
- 実際に学習させてみたら、さまざまな壁に当たりそう
アノテーション
- AI に学習させるための答え付きデータを作成する作業
時系列モデル
- 時間の流れの概念をもって学習し、未来の予測をするモデル
データ前処理
- 以下のの処理を行うこと
- データクリーニング
  - 欠損値の対応
  - 外れ値の対応
- 各種データ操作（試行錯誤が必要）
  - e.g.) 説明変数 A と説明変数 B の値のスケールが違いすぎる場合に、片方に合わせる
ニューラルネットワーク
- 入力層、隠れ層、出力層に分かれる
- 入力層が多くの情報を受け入れ、隠れ層をデータを渡す
- その学習の過程で情報が重要であれば太く、重要でなければ細く、重要度を加味しながら伝達されていく
- 隠れ層から出力層の間に情報の太さ・細さのコントロールによって正しかろうを答えとする
- イメージが湧くような湧かないような。別途知りたくなったら、色々参考になりそうな記事を見てみる
正解率（accuracy）
- 全体としての予測と答えの一致率
再現率（recall）
- 答えが正の中で予測が正とされたもの
適合率（precision）
- 予測を正と判断した中で答えも正のもの
AUC（Area Under the Curve）
- どれくらいバランスよく予測を当てられているかを測る指標
- True Positive Rate 及び False Negative Rate を計測
- それぞれ縦軸、横軸に曲線を描き、面積量がどの程度になるか
- カーブの下面積が広いほど精度が高い、逆に狭いと学習結果に偏りがある

第 4 章 AI の作り方をザックリ理解する

AI は特徴づかみの名人

大量のデータを暗記しているわけではない
- 大量のデータは精度に影響するが、それは特徴をつかみ法則を見つけるため
- 法則化されているからこそ未知の状態についての予測が高精度に行うことができる
ざっくりとした AI の作り方
- データ作成 → 学習 → 予測
- 詳細な例えがあって分かりやすかったが、前知識で充分であったためメモとしてはスキップ
意味合いを理解しているわけではない
- あくまですべてのデータが数値として把握され、データの意味合いを理解しているわけではない

「○○ 系 AI」の作り方を理解する

大枠の作成フロー
- 企画
  - AI プランニング
  - 目的変数/説明変数の定義
- データ作成
  - 学習データ準備
  - データ前処理
- 学習
  - AI モデル構築
  - AI モデル精度検証
- 予測
  - AI モデル実行
  - 運用、細学習
予測系 AI の作り方に関する要点
- 筋のよい説明変数をできるだけ多くピックアップ
- AI の目的によって適切な期間の学習データを利用
- 扱うデータによっては、ある範囲の数値をランクなどのグルーピングしてあげることで特徴量を捉えやすくするための加工が有効
- 生データそのものだけではなく、項目間の差や変化率に変換なども有効
- 訓練データと検証データの比率
  - 9:1 or 8:2 あたりが多い
識別系 AI の作り方に関する要点
- 予測系 AI とは異なり、アノテーション作業が必要
- 人手と時間がかかることは覚悟必須
会話系 AI の作り方に関する要点
- 質問、回答のペアデータをどうやって大量に集めるか
- 人との共働きをどう業務フローに落とし込むか
実行系 AI の作り方に関する要点
- 実行系 AI は他の機能を持った AI との組み合わせで作られることが多い
- 強化学習を用いる場合、報酬と罰、それぞれに対してどの状況のときにどんな重みをつけるか
- 実世界への適用前に、シミュレータ上での学習を繰り返すのが吉

第 5 章 AI 企画力を磨く

AI 企画の「100 本ノック」

想像できることは実現する
- フランス小説家ジュール・ヴェルヌ「人間が想像できることは、人間が必ず実現できる」
- アイデアを小振りなものにしないことを念頭に企画に取り組み、AI 導入のインパクト・変化量を大きくするためのアイデアに落とす
「誰のための AI？」「なんのための AI？」を軸として、まずは多くのアイデアを → 100 本ノックがおすすめ
- 立場の違う複数人、さまざまな視点から実施

「変化量と実現性」を担保する

一度膨らませたアイデアを実現に向けて収束させる
前述のステップで出たアイデアに対して、AI 導入後の変化量と実現性でスコア化
- ポイント：AI を過大評価も過小評価もしない
実現性の精度は AI の基本知識や作り方、事例を知ることで思考することができる

AI 企画の「解像度を上げる 5W1H」

WHO（誰のための AI？）
- 顧客、取引先、などの曖昧な粒度は避け、より明確に落とし込む
- 顧客：コールセンターに問い合わせるお客様、商品を買うのに迷っているお客様 etc…
- 取引先：新規の取引先企業、取引先の中の取り扱い上位 20％の企業 etc…
WHY（なぜ AI が必要？）
- マイナスを減らす or プラスを増やす
- 「誰のために」x「なぜ、なんのために AI を使うのか？」の掛け合わせが有効
- AI の導入を目的化せず、導入後の変化量が小さいようなら見送りも検討
  - ルールベースの方が簡単で品質も高いならそれで充分
WHICH（どのタイプの AI？）
- 8 つに分類した AI タイプのうち、どれが適しているか
- 「誰のために」x「なぜ、なんのために」x「どのタイプの」AI を使うのか
WHAT（どんな AI？）
- 以下のフレームで考えてみる
  - AI の呼称
  - AI ができること
  - AI によって解決されること
- 呼称を企画の文脈で出てくるのは面白いなぁと感じた
HOW（どう分業する？）
- T、O、逆 T、I 型、どの型が適切か
WHEN（いつまでにどう用意する？）
- 使う or 作る、から方針を決める
- 多くの場合は使った方が全体のコストが低くなることが多い
- 以下のフレームで検討してみる
  - 要件を満たす構築済み AI サービスがあるか？
  - カスタマイズ性は必要か？
  - 自前で学習データを用意できない？
  - 自前で作る人的リソースがない？
  - 運用保守、再学習体制は作れない？
  - 構築済みの AI サービスのほうがコスト安では？
  - 導入スケジュールは合うか？

第 6 章 AI 事例をトコトン知る

本書ではかなり多くの事例が紹介されている
必要になったら細かく見ようと思い、さらっと流し読みした

第 7 章文系 AI 人材が社会を変える

AI による「消費者、会社、働き手」への変化

消費者、会社、働き手にたいして大きな変化を起こすだろう
- 5G、IoT 普及（大量の学習データ）の後押し + AI の利用シーンが増えることで変化がもたらされる
消費者
- 暮らし、情報取得、買い物の仕方、移動や対人コミュニケーションのあり方など生活のあらゆるシーン
- 体感するところが多くありますね
会社
- 働き方や生産性向上のための仕組み、利用技術への AI 活用
働き手
- AI が多くの仕事を代行しくれたり、AI の指示に従って作業をするようになったり

第 7 章の残り

Amazon、ソフトバンク、日本国内の銀行を例に消費者、会社、働き手に対する変化を事例踏まえて紹介されている
MUFG の AI ラボは以下の業務に対して AI 活用を積極的に行なっていくことを公表
- 応答
- 帳簿処理
- 検索
- 営業支援
- 審査

雑感

ここで得られる知識は、入門レベルのものではあると思いますが、聞いたことがある、というレベルの単語の意味や概要がまとめて把握できた
どうやって作るか？という点が、技術的な話を最低限にまとめてあるので初心者の僕にはありがたかった
活用タイプの 8 分類、明確で分かりやすい
- 作りたいものが出てきた場合に「どのタイプの AI に該当するか？」から考えることができそう
- 思考の道筋が立てられるようになっていると感じる
今年は読んだ本を本記事のように、メモとして残していきたい
- 読んだそばから内容を忘れていく…
- yatteiki