п»ї ヒトと学習機械の共存・共生・共進化 『みんなで機械学習』第4回 | ニュース屋台村

ヒトと学習機械の共存・共生・共進化
『みんなで機械学習』第4回

3月 08日 2021年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社Aデコード研究所設立準備中。元ファイザージャパン・臨床開発部門バイオメトリクス部長(臨床試験データベースシステム管理、データマネジメント、統計解析)。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

ヒトと道具は共進化しているのだろうか。道具が進歩しているとしても、道具を使うヒトは退化している可能性は否定できない。退化も含めるのであれば、ヒトと道具は相互に影響しあって共進化しているのだろう。ヒトが使う道具には言語も含まれるかもしれない。しかしデータは、コンピューターにとっての自然であって、ヒトの道具ではない。地球環境などの自然が、ヒトの道具ではないのと同じ理屈だ。データをヒトの道具にしてしまうと、コンピューターは自然を失い、暴走するかもしれない。データサイエンスには、データをヒトの道具にしない、コンピューターにとっての自然を保護する重要な役割がある。これは単なる比喩(ひゆ)ではなく、データサイエンスで暴利を企むヒトへの警告だ。ヒトとコンピューターは、共存・共生・共進化する、それはヒトの最後の生存戦略だと思う。SF映画なら、最後のヒトの生存戦略というかもしれない。

前稿では、若い統計ソフトjamoviで解析するデータを準備した。電話会社が、解約(churn)する顧客のパターンを知りたいという問題設定だ。解約する(Yes/No)を目的変数とする多変量ロジスティック回帰を試してみよう。古典的で初歩的な統計解析の方法なのだけれども、実際に解析しようとすると、初心者はどこから始めたらよいかわからないかもしれない。こういう統計的予測の問題では、学習用データとテストデータを無作為に分けるのが原則で、クロスバリデーションという。学習用データで、無理やり予測誤差を最小化すると、過学習になり、テストデータでは逆に成績が悪くなってしまう。学校教育のガリ勉に似ている。教育用でとても親切なjaspでは、自動的にクロスバリデーションの準備をしてくれるので、jamoviとjaspを両方使うと、とても便利だ。

解析方法は、AnalysesタブのRegressionからBinominal Logistic Regressionを選択する。目的変数と、共変量(連続値の説明変数)と因子(カテゴリー値の説明変数)を指定すれば、ほぼ自動的に解析結果が得られる。AccuracyやROCカーブのAUC値などを参考にしながら、適切な説明変数を選択する。今回は19個の説明変数から、六つを選択してみた。

Accuracyは0.75でほぼ満足行く結果だろう。jaspには機械学習のモジュールがあり、最近はやりのGradient Boosting法で解析してみたら、Accuracyは0.80だった。小さな違いのようだけれども、100年ほどの進歩がこの違いなのだ。前者が古典的な統計解析で、後者はAI(人工知能)で活用される機械学習の結果だ。この両者の解析方法の違いが大きいデータと小さいデータがあるけれども、データが大量にあれば、ほぼすべての場合で機械学習の結果のほうが、予測精度がよい。しかも、変数選択を自動で行ってくれる。『みんなで機械学習』をしよう。

今回紹介したGradient Boosting法はMicrosoftがLightGBMプログラムを無償で配布し、特許も出願して積極的に推進している。機械学習というと、囲碁のトッププロを破ったDeep Learning法が有名で、自動運転にも活用され、Googleが積極的に推進している。機械学習はGAFAが独占しているかと思うと、案外、特許は中国のほうが多い。機械学習やAI技術は、米国と中国の覇権となっている。それなのに、『みんなで機械学習』をする、とはどういうことだろうか。米国や中国では『みんなで機械学習』をしていないから、彼らには未来はない。少なくとも、責任のある未来を切り開くことはできない。米国や中国では、ごく一部の大企業や、大企業や大学に勤めるデータサイエンティストだけが、機械学習のプログラムを作り、使って、お金を儲けている。そういう時代は100年と長続きしないだろう。最後のヒトが100年後にいなくなるのであれば別問題だけれども、ヒトは学習機械と共存・共生・共進化して生き延びてゆくかもしれない。機械学習は学習機械へのはじめの一歩であると、筆者は信じている。これで、『みんなで機械学習』の1回転目を終わりにしたい。本稿が発見しようとしている、中小企業経営の「のりしろ」とは、マージナリズム(marginalism)、データとともに周辺化する哲学、脱中心化の経営哲学だ。次稿の2回転目では、機械学習を使ったビジネスモデルの特許データを、小学生程度に機械学習してみよう。

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、オープンソースの無料ソフトjamoviでみんなと学習します。質問があっても、絶対にニュース屋台村にはコメントしないでください。株式会社Aデコード研究所(設立準備中)でjamoviと本稿の続き(4回転半の後)をサポートする予定です。

コメント

コメントを残す