п»ї インディアンはウソをつかない 『みんなで機械学習』第48回 | ニュース屋台村

インディアンはウソをつかない
『みんなで機械学習』第48回

10月 14日 2024年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆小休止と大テーマ

データ論として取り組んだ「スモール ランダムパターンズ アー ビューティフル」に、宿題が残った。その宿題では、より具体的に、農業分野における近未来のAI(人工知能)技術のありかた、特に個体差の機械学習(フェノラーニング®)の展開について考えている。生成AIの大規模言語モデル(LLM)の問題点として、固有名詞を「責任」をもって理解できないということは、何度か指摘してきた。前稿では、その問題の根源に、現代論理学の限界があることに気がついた(例えば、※参考:『まったくゼロからの論理学』〈野矢茂樹、岩波書店、2020年〉)。論理学という、高度に抽象的な言語活動において、具体的な事象から、抽象化するプロセスが明確に規定されていない。「集合」という、具体的であり、抽象的でもある数学的な概念に依拠して、この問題を回避している。「集合」の集合が必ずしも集合になるとは限らないので、「集合」の部分集合が集合となる集合だけを「集合」と定義する。数学的には厳密な定義であっても、論理学としては、何を意味しているのかよくわからないだろう。もっと具体的に、「すべての人」という論理式で、人にソクラテスを代入するときに、名前のない人の存在を無視して、名前のある個人の有限集合で考えることが、標準的な論理学の教科書的解釈だ。名寄せの作業が困難であること(同一の人物に多数の名前が対応するため)、災害時の行方不明者の人数を正確に把握することが困難であることなどを全く無視するのだから、論理的な議論は、少なくともデータの世界では役に立たない。

この大きな問題に、筆者なりの考えをまとめておきたいと思い、農業話題は小休止することにした。そうはいっても、論理学の学問的な問題を本拙稿で議論するつもりは全くない。結論から述べると、機械学習を含むデータサイエンスのコンピュータープログラムは、大規模言語モデルを発展させた生成AIが作成する時代が目前にある、という単純な出発点を確認して、その先の近未来をディストピアにしない作戦を考えるという、以前からの本連載の主題を、少しだけ哲学的に考えてみたいというだけのことだ。

命題論理や述語論理の論理式も、データサイエンスのプログラムの一部でしかない。筆者がコンピューターのプログラムを作り始めた1970年代では、コンピューターの機械語(01の連鎖)を、英語に近いアセンブラーやフォートランのプログラムから、コンパイラーという翻訳プログラムが作成していた。コンピューターシステムの機械(記憶装置や印刷機など)の制御を、オペレーティングシステム(OS)のライブラリープログラムに実行させるという方式が、画期的な成功をおさめ始めた時期だ。コンピューターサイエンスの全盛期だった。以降、50年間に作成されたプログラムは膨大な量になり、プログラマーが作ったプログラムを、大規模言語モデルが機械学習して、AIがプログラムを作成する時代となった。

英国で蒸気機関が発明され、産業革命が始まった18世紀末には、動力と機械が合体して、世界の産業政策と軍事技術に革命的な変革をもたらした。哲学としては、欧州の合理主義哲学が開化したけれども、21世紀には哲学そのものが解体されつつある。産業革命も、地球環境や人類社会に深刻な問題をもたらし、ディストピア化した技術となった。AIがデータサイエンスのプログラムを作成する近未来では、18世紀末の産業革命を上回る、社会の急激な変化が予想されるのに、哲学が無力であるため、技術論すら機能せずに、無批判・無反省に、LLMなどの機械学習が、近代文明を消費し続けている。

◆小休止するアメリカ哲学

英国でバートランド・ラッセルとともに活躍し、米国に移住して独自の哲学を切り開いたアルフレッド・ノース・ホワイトヘッドの『過程と実在-コスモロジーへの試論<1><2>』(みすず書房 1981年、1983年)は、難解な哲学書だ。拙稿では、「過程と実在」に書かれていない「データ」を代入して読むこと(※参考1:『住まいのデータを回す』第21回「データ論の準備(4)問題設定」)、「過程と実在」(process and reality)を「過程とデータ」(Process and data)と読み替えること(※参考2:『週末農夫の剰余所与論』第16回「プロセスとデータ」などを提案してきた。

システムではなく、プロセスを重視する思想の萌芽は、米国哲学の出発点となったチャールズ・サンダース・パース(1839~1914年)のプラグマティズム、記号論、アブダクションなどどに遡(さかのぼ)る。筆者としては、シューマッハー(1911~1977年)の「スモール イズ ビューティフル」を、機械学習によって実現するというミッションに従っているので、小さい哲学を志向している。より正確には、周辺主義(マージナリズム)の「小さいプラグマティズム」を、未来志向の技術論として考えている。

パースの思想は、時代に先行し過ぎていた。最近になって、コンピューター科学との関連で再評価されている。特に、説明仮説による探求の論理(アブダクション)は、演繹(えんえき)的論理や帰納的論理の古典的な論理推論形式とは異なり、統計学の仮説検定理論を弱めた、探索的データ解析に近い考え方で、機械学習と相性が良い(参考:『アブダクション―仮説と発見の論理』〈米盛裕二、勁草書房、2007年〉)。しかし、最近の生成AIでは、哲学よりもビジネスが優先で、未来は投資のためにあるかのような錯覚をしている。哲学どころか、論理学も関係なくなり、未来の文明のありかたなど全く考慮されずに、明日の金儲(もう)けだけにしか興味がない。大陸の合理主義哲学が「不合理」であることは歴史的にも確実で、アメリカ哲学が小休止している間に、米国は覇権国家としての文明崩壊を迎えようとしている。

◆インディアンはウソをつかない

アメリカ哲学がAI哲学として目覚めるとき、その論理学は、データ論理となるはずだ。データ論理は、演繹・帰納・アブダクションを、データ解析のプロセスとして定式化する。もともとのデータが固有名詞であったとしても、固有名詞を数字で表現(コーディング)するときに、固有な対象から抽象化される。最重要な固有名詞である「場所」は、幾何学のように空間的に抽象化されるので、コード化された場所は、近傍や包含関係を伴う、位相関係が抽象化された論理構造を持つ。機械学習技術によって、コーディングが自動的に行われる、抽象的なデータ論理がAI哲学の出発点となるだろう。自動的にコーディングされる大量のデータを、生成AIがデータ処理のプログラムを自動的に作成して、意味不明のデータから、言語表現としての「意味」や「価値」が発見される。もともとの固有名詞は、特定の地域や人びとに属するものであって、ある領域の中でしか意味を持たない。ある領域の中で機械学習をして、発見された「意味」や「価値」を共有することで、より大きな領域に一般化してゆく。その学習プロセスは民主主義的なプロセスだ。現在の大規模言語モデル(LLM)は、固有名詞を信頼できるようには認識していないし、知識を一般化するプロセスも民主主義的では無い。哲学は、高度に抽象的な概念を取り扱うけれども、抽象的な概念を学習するLLMも実現できていない。

固有名詞を抽象化するプロセス、コーディングにデータ論理の秘密があることまでは確かだとしても、コーディングを論理的に説明することができない。筆者は、医学データのコーディングに40年以上関与してきた経験から、データの世界では、「インディアンはウソをつかない」ということが、最良で唯一の規範(ロジック)だと考えている。「ウソをつく必要がない」「ウソをついてもすぐにバレる」「データの定義域を幾何学的に明確にする」など、データに関する人間的なロジックは様々に考えられるけれども、機械学習にとっては、より代数学的なロジックが必要となるだろう。高度に抽象的な概念を、場所の論理を抽象化するモデルによって、概念間の関係として操作的(手続き的)に表現するという課題だ。AI哲学は、哲学的な抽象概念を機械学習する方法が出発点となる。哲学の無いAIとは異なって、AI哲学は、近未来のデータ文明がディストピアとなる無謀な覇権争いを、賢く回避する探究路を、複数示唆してくれるはずだ。近未来のデータ文明は、太古の文明と同じように、人びとの冒険心によって切り開かれる。

◆南極大陸に近い大陸が新文明となる

アメリカ哲学がAI哲学として目覚めたら、どこでどのような産業革命がもたらされるのだろうか。南北アメリカ大陸が新大陸として発見され、西欧人が先住民を迫害し、領土を奪った。しかし、南北アメリカ大陸には、いまだに多くの先住民が生活し、ディストピアではない未来を必要としている。拙論の農業AIは、日本の山間部での小規模農業を、都市部の家庭菜園に接続することを夢想している。しかし、このような社会実験が、本当に人類の未来にインパクトを与えるとすれば、その表舞台は、南極大陸に近い、アフリカ大陸や南アメリカ大陸ではないだろうか。

蒸気機関の発明が、西欧文明に産業革命をもたらした。AI技術が、当時の産業革命以上に、人類社会に大きくて急速な変化をもたらすことは確実だろう。しかし、AI技術のAI哲学が誕生していないので、AI技術の意味や価値を、言語によって理解したり批判したりする段階には至っていない。試行錯誤して、ビジネスとして競争するか、そのビジネスを倫理的な観点から規制しようとしているだけだ。農業AIは健康産業の新展開を目指している。西欧文明は、身体の解剖学を発展させたけれども、心身の健康状態を定量的に評価することには成功していない。複雑系の科学によって、要素分析的な科学の限界が明確になり、コンピューターシミュレーションの有用性が公認されるようになった。しかし、地球科学のように大きな問題は別問題として、各個人の健康状態をシミュレーションするためには、個体差のある健康データの機械学習が必要で、現在の先進諸国におけるAIビジネスでは、高価な医療に役立つ程度だろう。健康データを機械学習する個別化栄養学は、日本のような医食同源の文化的な背景によって実験をして、医療体制が不十分で、実効的な感染症対策を必要としている地域で発展し、西洋医学を根底から再考させる状況となって、近未来の健康産業が、文明論的な変革に導くだろう。

文明論的な変革には、文明論的な背景と時間が必要で、アフリカ大陸や南アメリカ大陸は、西欧文明によって迫害された、しかし自らの太古の文明も消滅してしまった、新文明にふさわしい文明論的な時代背景がある。AI哲学の出発点は100年後だとしても、データ文明の出発点は1000年後かもしれない。データ論理は、アメリカ哲学が小休止中であっても、日本のような、大陸にとっては辺境の列島で、試行錯誤が可能だ。次稿では、もう少し具体的に、データ論理をスケッチしてみたい。

※参考1:『住まいのデータを回す』第21回「データ論の準備(4)問題設定」(2020年4月1日付)

https://www.newsyataimura.com/yamaguchi-23/

※参考2:『週末農夫の剰余所与論』第16回「プロセスとデータ」(2021年6月16日付)

https://www.newsyataimura.com/yamaguchi-53/

※参考3:『みんなで機械学習』第32回「P(4+1)機械学習」(2024年1月9日付)

https://www.newsyataimura.com/yamaguchi-107/

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。

コメント

コメントを残す