п»ї 空 『みんなで機械学習』第40回 | ニュース屋台村


『みんなで機械学習』第40回

6月 05日 2024年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆制作ノート

英国の経済学者エルンスト・シューマッハー(1911~1977年)の「スモール イズ ビューティフル」における中間技術の提案を、「みんなで機械学習」として実現するため、「スモール ランダムパターンズ アー ビューティフル」という拙稿を連載している。前回は、人工知能(AI)の根っことなる「固有場知能」(ネイティブ・インテリジェンス)を、本シリーズの到達点としてまとめ、「固有場知能」を活用する農業を次のシリーズの宿題とした。「スモール ランダムパターンズ」は、本当に「ビューティフル」なのだろうか。「ランダム」な「パターン」は、そもそも矛盾した概念だ。しかし、自然においては、量子力学の2重スリット実験のように、論理的には理解しがたい確率的な「ランダムパターンズ」が存在することも事実だ。筆者は中学時代から西洋哲学にはまり、論理学の本も多数読んでいる。厳密な数理論理学(ゲーデルの不完全性定理など)によって明らかになったことは、論理は数学の証明には不可欠であっても、数学を記述するためには表現力不足ということだ。言語や絵画の表現力が、数学よりも豊かであることは疑いようがない。それでも、「スモール ランダムパターンズ」は「ビューティフル」か、という問いに答えは無さそうだ。論理で考えれば、無から有は生まれない。しかし、真空から対称性の破れによって、エネルギーや物質が生まれる。「空」を真空と考えるか、雲がある「そら」と考えるのかは、文脈に依存してはいるものの、「空」をどのようにイメージするのか「自由」だ。「ランダムパターンズ」の「自由度」が、「ビューティフル」かどうかは、人びとと共有する表現の場が「自由」であることを問うているようにも思われる。

「スモール ランダムパターンズ アー ビューティフル」のゴールは、結論を論理的に構築することではなく、生活のライフサイクルにおいて、データの世界との共存・共生・共進化に希望を実感することにある。近代的なモノの価値に従属する経済から、コト(サービスなど)の意味を重要視する経済への移行を時代背景として、近未来のデータサイエンス テクノロジー アンド アート(データの世界)が、人類の文明論的な変革をもたらす夢物語を、少なくともディストピアとはしない、複数の探索路を切り開こうとしている。次シリーズの「固有場知能」(ネイティブ・インテリジェンス)農業の思考実験が、その導入路となるために、「固有場知能」について深く掘り下げ、ビジネスとしての足場を固める具体策を試行錯誤することになるだろう。

東京の空 2024年5月9日 筆者撮影 

『スモール ランダムパターンズ アー ビューティフル』

1   はじめに; 千個の難題と、千×千×千×千(ビリオン)個の可能性

1.1 個体差すなわち個体内変動と個体間変動が交絡した状態

1.2 組織の集合知は機械学習できるのか

1.3      私たちは機械から学習できるのか

2   データにとっての技術と自然

2.1 アートからテクノロジーヘ

2.2 テクノロジーからサイエンス アンド テクノロジーへ

2.3 データサイエンス テクノロジー アンド アート

2.4 データサイクル

2.5 データベクトル

2.6 局所かつ周辺のベクトル場としてのデータとシミュレーション

3  機械学習の学習

3.1 解析用データベース

3.2 先回りした機械学習

3.3 職業からの自由と社会

3.4 認知機能の機械学習とデジタルセラピューティクス(DTx)

3.5 学習は境界領域の積分的探索-ニッチ&エッジの学習理論

3.6 機械学習との学習

4  機械学習との共存・共生・共進化-まばらでゆらぐ多様性

4.1 生活と経済の不確実性

4.2 生活と経済に関連する技術は、何を表現しているのか

4.3 スモール データ アプローチ-個体差のまばらでゆらぐ多様性

4.4 まばらでゆらぐ多様性の過去・現在・未来

4.5 生活の不確実性を予測する

4.6 弱い最適化脆弱性/反脆弱性からのスタート

4.7 ひとつのビッグ予測、たくさんのスモール適応

5  自発的な小組織(seif-motivated small organizations)

5.1 社会、地域、家族 vs. 国家、企業

5.2 組織は組織でできている組織サイクル

5.3 機械学習する組織

5.4 CAPDサイクル

5.5 ビジネス表現の個体差(AI中心8画面周辺モデル)

5.6 組織の周辺積分的思考

5.7 データサービス商品を創出する知的自由エネルギー産業-固有場知能農業(前稿)

6  おわりに;生活と社会のビューティフル ランダム パターンズ(本稿)

「ニュース屋台村」に原稿を書き始めた2017年1月31日(※過去記事1参照)、筆者の手元には米国ニューヨーク在住で、急逝(きゅうせい)したアーティストの知人、中里斉さん(1936~2010年、https://ja.wikipedia.org/wiki/%E4%B8%AD%E9%87%8C%E6%96%89 )への追悼文があった。中里さんと、ライプニッツの『モナドロジー』(岩波文庫 青 616-1)の話をしたのがきっかけだ。中里さんは「モナド・シリーズ」を連作していた。この連作は、2001年の「線外シリーズ」に始まり、2009年にスタートする「黒い雨シリーズ」に引き継がれる、中里さんの日記であり思考実験でもあった。ライプニッツの『モナドロジー』(単子論)は難解な哲学で、個体性と普遍性について、「おばけ」のように考え抜いている。中里さんは、その西洋哲学の「おばけ」と格闘していた。筆者は話し相手としての役にすら立たなかったけれども、ライプニッツの数学と、数学の世界について話した記憶がある。中里さんとしては、数学のような抽象的な世界よりも、「黒い雨シリーズ」に至る、社会的現実をイメージとして抽象化する可能性を考えていたのだろう。ライプニッツを相手に、近代化する西洋社会と格闘していたのかもしれない。そしてイメージの探求は『モダニズム・ニューヨーク⇔原風景・町田』(町田市立国際版画美術館、2010年)に結実して、突然途絶(とだ)えた。

6.1 ほとんど色即是空・空即是色な世界(本稿)

本論考はデータ論であって、遺伝子データや医療画像のような、個体差がある網羅的データが、スパース(疎)なデータであることが出発点になっている。通常の多変量解析では、複数(N個)の変数と複数(M個)のオブザベーション(個体数)からなるNxMのデータ行列において、MのほうがNよりもはるかに大きい状況を想定している。しかし、変数が遺伝子変異のような場合、NのほうがMよりも大きいけれども、データ行列のほとんどはゼロという、かなり異常な状況もよくある。社会調査においても、調査項目を増やしてゆくと、全く該当しない項目が多数含まれることになり、やはりスパースなデータ行列となる場合が多い。スパースなデータ行列の場合、NとMの役割を入れ替えてみると、個体間の関係が見えてくる。すなわち、個体差の問題となる。スパースなデータを多変量解析するための統計的モデル化もそれなりに工夫されている。画像データでは、画像として意味がある(写真などではない)、文字データや医療データの場合は、かなりスパースなデータとなる。特に画像データでは、ディープラーニングなどの機械学習の方法が有用だ。

データの世界は、言語の世界と異なって、個別のデータそのものには意味が無い(意味がよくわからない)ことが多い。データ全体としては、何らかの意味が有ることが確実と思われるので、データの意味を探索することになる。自然科学であれば、実験や測定によって得られるデータの取り扱いには慣れている。データの意味を探索することは、すなわち、科学的な仮説を作ることに相当する。科学的な仮説は、別途、データによって検証されることになる。歴史学や社会科学においても、言語をあえてデータと考えて、統計解析によって、潜在的な意味を探索することも行われるようになった。最近の機械学習では、言語を数万次元のベクトルの連鎖と考える大規模言語モデル(LLM)が、言語の意味を理解しているかのような、自然な言語表現を生成するようになった。言語データにおいては、機械学習によって、データの意味を探索することが、ほぼ自動化されたと考えられる。意味の無い(意味がよくわからない)データからは、経済的な価値は生まれない。機械学習が、データの意味を抽出できるようになったので、データの経済的価値が明確になり、「データ資本主義」などと呼ばれることもある。データの魔力とAI魔術を追い求める「分断された」グローバル資本主義が、覇権国家の経済力と軍事力の源泉となっている。力の論理は、古典的なニュートン力学の世界観で、時代遅れとしか言いようがない。統計力学と情報理論が融合した現代の物理理論によって、経済や軍事の自由エネルギーが、ミクロからマクロへと、組織のスケールに依存せずに定義されるようになり、組織や社会の効率が実測できるようになれば、覇権国家の自由エネルギー効率が最適であるとは限らない。

価値あるものを贈与・供託する性善説の社会観、暴力で略奪・支配する性悪説の社会観、法律と税金によって円滑で合理的な社会制度を実現する試み、それぞれ歴史的な背景や政治的信条は異なっていても、論理的な選択肢であるかのように思えても、社会理論としては、それぞれ不十分で不完全だ。データの魔力とAI魔術とともに生きる近未来の社会は、過去の歴史が山積みにした社会問題を解決できなければ未来が無い、崖っぷち(カオスのふち)なのだから、論理的では無いかもしれないけれども、人類が経験したことの無い、冒険が求められている。古代社会が「自給自足」で平和な社会だったという幻想は、考古学の事実確認によって、明確に否定されている。しかし、武器を使う戦争は、人類だけの歴史的事実であることも確実だ。理由は別問題として、最強の肉食動物であった恐竜が、絶滅したことも事実だ。人類が絶滅を回避することができるとすれば、「自給自足」について再考してみることは有益だろう。古代社会には、すでに物流や分業があったし、そもそも植物のように栄養を自給することができない人類の社会が、「自給」社会であるはずがない。しかし、太古の社会は「自足」して平和な社会であった可能性は否定できない。「自足」する、「足るを知る」ことは、動物たちには当然のことのはずだ。人類には何かが欠落していて、「不足」している何かを「自給」するのではなく、盗んだり略奪したりする「悪知恵」が優先されるようになったとは考えられないだろうか。人類に欠落している「知能」を、批判的にイメージするのは哲学者の役割だろう。ギリシャ哲学が、ローマの帝国主義に敗れた時、人類史として、「自足」を失う変質があったように思われる。

近未来のデータ文明においては、データの「自給」も「自足」もあり得ないのだろうか。ビッグデータを追い求めている限り、データの「自給自足」は、想定すらされていない。現在のAI技術において、確実に欠落している「知能」は、固有名詞を理解する「知能」だ。AIは母親をママ(mother)と言ったり母(かあ)ちゃんと言ったりすることを理解できるようになったけれども、固有名詞としての特定の人物の母親を、裁判所におけるDNA判定のように、責任をもって判断する能力は無い。母親を特定する「責任」についても、理解していない。AIに不足している能力を、人びとが協力して「自足」する状況をイメージできるだろうか。自分自身の健康問題を解決するために、個人の健康データを「自給」することは可能だろう。データを「自給自足」する社会は、社会問題や環境問題を解決するためにも、データを「自給自足」できるはずで、「自給自足」しない社会よりは平和で持続可能な社会になるだろう。

イタリアの物理学者、カルロ・ロヴェッリの『時間は存在しない』(NHK出版、2019年)では、離散的な物事の継起が重要で、物理法則の記述には、連続的な時間概念は必要ないとされる。量子論における因果関係や多世界解釈を、専門家として熟考した後に、専門家以外に時間の意味と、その解釈の可能性を丁寧に説明している。仏教においては、物事の継起を「縁起」と表現して、人間関係にまで拡大解釈した後に、「縁起」によって全ての関係がつながっているとともに、全ての関係は限りなく疎(空に近い)とされる。カルロ・ロヴェッリの世界観は、仏教の「色即是空・空即是色」の世界観に近いように思われた。そして何よりも、筆者にとっては、データの世界は「色即是空・空即是色」の世界に近いように思われる。「色即是空・空即是色」を何度も唱えていると、論理が回り始める。西洋合理主義の論理は、直線的で、世界に隙(すき)間を作らない。物理的な世界は、複素数で記述される場合もあり、ブラックホールのような特異点があったり、初期条件や境界条件に強く依存するカオスも存在したりする。西洋合理主義の論理は、特殊な歴史的な条件下での論理でしかない。「自給自足」する社会と、仏教的な世界観がどのような関係にあるのか、関係が無いのか、本シリーズの「1.はじめに」を書き始めた時から考え続けているけれども、まとまった考えには至っていない。「自給自足」する社会と、データの世界には、有るようで無い、無いようで有る、回る論理のような、確率的な関係がありそうだ。次シリーズの「固有場知能」(ネイティブ・インテリジェンス)農業の思考実験は、「データ」を食べること、食べて世界を理解する冒険から始めてみたい。

◆次回以降の予定

6.2 ランダムな人びと

6.3 データ化する私(datanize me)

6.4 延長されたフェノラーニング®

※過去記事1

『データを耕す』第1回「自動運転車は何馬脳なのか」(2017年1月31日付)

https://www.newsyataimura.com/yamaguchi-117/#more-6319

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。

コメント

コメントを残す