п»ї 機械学習は学習機械ではない 『週末農夫の剰余所与論』第11回 | ニュース屋台村

機械学習は学習機械ではない
『週末農夫の剰余所与論』第11回

2月 03日 2021年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社エルデータサイエンス代表取締役。元ファイザーグローバルR&Dシニアディレクター。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

米国新大統領は民主主義の勝利だと宣言した。民主党の勝利だったかもしれないけれども、大きな違和感が残る。ドナルド・トランプ前大統領は民主主義の自爆テロだった、しかも自国民に対するテロだ。テロとの戦いには見通しが立たない。いつまでも泥沼が続くのだろうか。

経済格差が増大し、SNS(Social Network System)への依存が高まることで、社会が分断されたのではない。理性が分散してしまったのだ。より正確には、人間的な社会指標の分布は、古典的な意味での数学的な裏付け(中心極限定理)がある正規分布ではなく、分散の期待値が無限大に発散する分布になっているに違いない。分散の期待値が発散する分布関数があることは知っているけれども、どのような条件でそういった分布が生じるのか、筆者は知らない。

週末農夫は、農作物を作ることに専念し、売買するわけではないので、季節変動を純粋に受け入れることができる。人間中心主義では週末農業を楽しめない。神がいれば理性は発散しないはずだし、自然においても分散は発散しない。偽善者の心地よい政治的発言に思考停止するのではなく、人間中心主義を深く反省する必要がある。

「機械学習」とは、例えば犬の写真と猫の写真を見せて、犬か猫かを当てるゲームのようなもので、そのゲームを行うコンピュータープログラムをコンピューター(万能計算機械)自身が作成することを意味している。

大きく区別して、教師有り機械学習と教師無し機械学習がある。教師有り機械学習は、犬と猫の大量の写真に教師が犬か猫かの正解をつけて、プログラム自身が正解率が高くなるように機械学習する。文字識別のような視覚データ処理としては古典的なパーセプトロンの理論の延長上にあるとはいえ、何十枚もの層を重ねて処理するディープラーニングの性能は圧倒的だった。ついには機械同士でゲームを対戦させ、勝者を教師として学習することを延々繰り返して、囲碁や将棋ではプロでもこのようにして機械学習したコンピューターには勝てなくなってしまった。

しかし教師有り機械学習は、教師有りということ自体に大きな限界がある。膨大な量のデータを集め、多額の人件費を使うか、ゲームのような仮想世界で満足するしかない。一方で、教師無し学習は統計解析による学習を意味していて、特に探索的データ解析を統計専門家ではなく、強力な統計アルゴリズムが機械的に行う。例えば、3種類のアヤメの花を分類する問題が有名で多変量解析の教科書に紹介されているけれども、遺伝子の全DNA配列を分類しようとすると、機械学習を行いたくなる。教師有り機械学習では、視覚や聴覚の生理的なデータ処理機構がある程度モデル化されているのに対して、教師無し機械学習では論理的な判断や整合性しか手がかりがなく、学習機構に関するモデルが考慮されていない。

機械学習は学習プログラムを自動的に最適化するけれども、自発的に学習する学習機械ではない。すなわち、学習の目的があらかじめ定められていて、学習目的を疑ったり、新たな学習目的を発見したりすることはできない。機械なのだから当然だと思うだろうか。人間の学校教育も、試験で高順位をとるという機械学習をしている。多くの教師有り機械学習と、一部の数学における教師無し機械学習だ。学生としては自発的に学習しているつもりでも、教育プログラム自体が機械学習のプログラムでしかないからだ。

教育批判をしようとしているのではない。現在の機械学習の限界を明らかにして、場合によっては、学習機械が可能になるのではないかと考えている。最初に民主主義の限界に言及した。人間中心主義ではない民主主義的社会のイメージとして、生態学的および量子力学的社会を提案したい。生態学的社会は多様性を尊重し、生存のニッチを保証するという意味では民主主義社会の延長上にある。しかし「多様性」の定義自体を再考する必要があるだろう。まずニッチを探すために、多くのエッジ(冒険的試み)をはぐくむことができるニッチを再定義する。そして、ニッチの総数が多様性なる。性別という生物学的な多様性ではなく、家族のような共同生活を営むニッチとして、同性愛者のカップルもニッチとなりうるし、経済的目的で離婚を繰り返す英米のセレブたちにニッチはない。

量子力学的社会としては、Danah ZoharとI.N.Marshallの『Quantum Scociety』(1993年、Bloomsbury Publishing PLC)が直接的な提案だろう。ダナー・ゾーハーは『クォンタム・セルフ―意識の量子物理学』(1991年、青土社)の翻訳本もある。読みものとしてはとても面白いけれども、社会理論というよりは共同作業も含めた意識の量子物理学だ。量子力学の不確定性原理が出発点だとしても、筆者のイメージはより数学的で、不確定性の程度を非可換性の程度で評価することを重要視している。従来の数学は可換代数および等式 ABS(a・b – b・a) = 0 によって支えられてきたけれども(ABSは絶対値またはノルム)、量子力学では ABS(a・b – b・a) = Δ となり、一般にΔは小さいけれどもゼロにはならないために、不等式を評価しなければならない。このような非可換性はa、bが数ではなく、演算子や関数の場合にはありうる。常識的な因果関係では理解できない量子のもつれを記載するベルの不等式(※参考: https://www.nikkei-science.com/201902_054.html 日経サイエンス2019年2月号)は量子力学を仮定すれば数理で証明できるし、正しいことが実験的に確認されても、その意味を理解して素人に説明できる物理専門家はいない。もっとも、量子力学の多世界解釈は、その物理的意味が分からなくても、転生を信じることができる素人のほうが受け入れやすいかもしれない。

小さいけれどもゼロにはならないΔは、統計学の有意水準を示すP値(例えばP <0.05)とは違って、人間が勝手に決めた水準ではなく、自然を理解できない度合いの絶対的な水準となっている。量子力学的社会にも、合理的には理解できない水準を見定めて、過剰な期待を抱(いだ)かないようにするΔが必要だろう。より正確には、期待値を考えざる得ない状況で、期待値の持つ絶対的な限界・理不尽さを理解することが大切だ。

生態学的および量子力学的な社会のイメージは、生態学的および量子力学的な教育のイメージに重なり、自発的に学習する(一見意識がありそうに見える)学習機械のイメージに発展する。筆者の好みで言い換えれば、神すなわち自然を教師とする機械学習であれば、学習機械になりうるというわけだ。合理性の中に、本質的な意味で小さなランダムネスを認めることは、大きく増幅される可能性も非常に小さい確率でありうることになり、そのような増幅機構が解明できる可能性もある。

機械学習、特に教師無し機械学習の限界を乗り越えるために、生態学や量子力学からヒントを得て、ついには神すなわち自然を教師とする教師無し機械学習に行きついてしまった。これほど遠くまで行く必要はないので、とりあえず先に道がつながっていればよいだろう。筆者はそれを表現論を基盤とする表現型機械学習(フェノラーニング)と想定して、準備を進めている。統計的機械学習から先の道には道標はなく、目的地も明らかではない。長い道のりになること、多くの分岐があることは確かだ。しかし、民主主義政治の先の道も同じような状況にある。先を急がないほうがよさそうだ。

人間社会は時として暴走する。自動運転車も暴走して事故を起こす。学習機械も暴走するのだろうか。学習機械が暴走するとすれば、その機械は哲学をしているのだろう。前稿は計算機哲学試論(an essay for computational philosophy)だった。今回はその続きを書いたつもりだ。続きの続きは、振り出しに戻って統計計算の初歩から『みんなの機械学習』へと案内したい。農閑期でもあり、本シリーズは少しお休みをいただくことにします。

--------------------------------------

『剰余所与論』は意味不明な文章を、「剰余意味」として受け入れることから始めたい。言語の限界としての意味を、データ(所与)の新たなイメージによって乗り越えようとする哲学的な散文です。カール・マルクスが発見した「商品としての労働力」が「剰余価値」を産出する資本主義経済は老化している。老人には耐えがたい荒々しい気候変動の中に、文明論的な時間スケールで、所与としての季節変動を見いだす試みです。

コメント

コメントを残す