山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。
◆続・データと遊ぼう
「ニュース屋台村」の読者の皆様には申し訳ないけれども、筆者は、政治や経済のような「真面目(まじめ)」な話題よりも、生活や仕事での新発見や冒険談を好んでいる。自分にとって面白そうな新発見(ほとんどが過去の勉強不足)や冒険談(哲学や文学)は、新聞記事やニュースなどで発見して、図書館の書物で感触を確かめることにしている。
熟読するときはネットの古本を探す。数学や仕事関連で興味深い新刊本は、すぐに入手困難になるので、あまり考えずに購入している。久しぶりの書店での立ち読みで、『THE UNIVERSE IN A BOX 箱の中の宇宙-あたらしい宇宙138億年の歴史』(アンドリュー・ポンチェン、ダイヤモンド社、2024年)を購入した。最新の宇宙論というよりも、実用的なシミュレーション技術に興味があった。
前稿の最後の提案「データと遊ぼう」(※参考1)は、「データ」をシミュレーションで作成して遊ぶという趣旨だった。前世紀末に流行した、コンピューターのライフゲームに、群れのルールを導入して、社会的な遊びのゲーム展開とすれば、集団が作る「データ」の形を鑑賞しながら、「遊ぶ」ための「データ」が作れるだろうという発想だ。
宇宙論のシミュレーションはまじめな科学研究だけれども、宇宙論の純粋な知的好奇心は、「遊び」の原点でもある。筆者としては、みんなの「遊び」の中から、新しい「データ」文明が芽生えることを夢見ているので、回り道には事欠かない。
日本には『遊びの博物誌』(坂根厳夫、朝日文庫、さ3-1、さ3-2、さ3-3、さ3-4、1977年に初版発行、1982年に『新・遊びの博物誌』初版発行)という、優れた「遊び」伝道師の著作がある。前稿(※参考1)で言及した、西欧のホイジンガやカイヨワのような重々しい哲学的な記述ではなく、新聞記者の洗練された文章で読みやすい。
『遊びの博物誌』で紹介された「遊び」の多くは西洋のもので、パズルや「だまし絵」などの視覚的な「遊び」の数理的な背景も解説されている。西洋の遊びが、「競争」や「ゲーム」の要素が強いのに対して、『遊びの博物誌』では、遊びにおける美的感覚や知的好奇心が重要視されている。特に、近未来を感じる自由な数学的発想として、「トポロジー」関連の話題が多い。「データ」の形を解析する「トポロジカルデータ解析」よりも半世紀先行している『遊びの博物誌』は、「データと遊ぶ」おもちゃ箱のようなものだ。
◆力の政治論理と利子の経済理論
AI(人工知能)の話題で、あえて「遊び」で回り道をするのは、技術に対して後ろ向きなAI規制の議論よりも、AIビジネスの儲(もう)けと軍事応用を優先する「短気な」政治経済の時代潮流を意識して、「短気な」AIビジネスとは一緒に遊ばない、筆者なりの決意表明でもある。
そうはいっても、まじめなデータサイエンスの実務は、筆者の生活の糧(かて)であり、ブラック企業に騙(だま)されないようにしたい、と願う一時避難でしかない。なによりも、AI技術に関しては、先回りする気持ちはあっても、後ろ向きな考えは全くない。難解な数学よりは、はるかに理解可能な技術の話であって、違和感は全くない。「データ」を語らないAI技術は無意味だと、遊ぶ前に切り捨てているだけのことだ。
近代から今日まで続く機械文明は、物理学と工学の時代でもあった。近代の物理学は、ニュートン力学から始まり、力の政治論理、すなわち、作用反作用の法則として、現代でも主流の政治力学だ。ニュートン力学は、砲弾の弾道予想で威力を発揮する、軍事技術でもある。作用反作用の法則であれば、弾道予想のような微分方程式は不必要で、やられたらやり返す、言葉の論理で十分に理解できる。
ケインズ(英国の経済学者、1883~1946年)の経済理論は、銀行の利子における複利の役割を、指数関数のイメージでとらえて、経済政策レベルまで応用可能にした。計量経済学のような、複雑な微分方程式は不必要であっても、指数関数を想像することは、足し算と引き算しか理解できない力の政治論理では不可能で、「短気な」政治論理では、経済理論は嫌悪の対象となる。
もちろん、指数関数的なネズミ算やネズミ講を言葉巧みに物語化して、裏社会で応用することは可能だ。しかし、裏社会や政治論理では、経済理論としての、微分方程式の解の安定性が説明されることは無い。理解不能で不確実な経済理論は、政治論理にとっては、考えるだけ時間の無駄、程度のものなのだろう。
最先端の科学技術、例えば核爆弾や半導体は、量子力学によって記述され、実用化されている。科学技術における、量子力学の有用性は疑いようがないけれども、量子力学は、数学的な記述だけではなく、物理学的な意味も難解で、政治論理や経済理論とは別次元の理解力や想像力が要求される。理解不能であっても、世界が不確実であるという確信(不確定性原理)は、政治論理や経済理論と共通している。
物理学のスーパースター、アインシュタインは、量子力学は不完全な理論体系で、量子力学の確率的解釈には懐疑的だった。しかし、発展途上の量子コンピューターは、「量子もつれ」という、量子の確率的な状態の重ね合わせを、技術的に操作して、正しい計算結果を導出することを、実用的なレベルで実証している。
一方で、アインシュタインの重力論(一般相対性理論)と量子論の融合である量子重力論は完成していない。量子重力論は、宇宙の始まりとか、ブラックホールなどの、非常に特殊な時間・空間の状態でないと、あまり必要ではなく、重力論と量子論、それぞれの物理理論を適切に適用すれば十分だと考えられている。しかし、最近の研究で、重力の起源は宇宙のエントロピーである可能性が示唆された(※参考2)。
エントロピーは熱力学の概念で、統計力学によって計算できる物理量だ。量子重力論と統計力学が接近することで、重力論や宇宙論が急に身近になった感じがする。具体的には、時間の不可逆性をエントロピーの増大法則から理解することが可能になるかもしれない。近代哲学や物理学の、ゆるぎない基盤と思われていた時間概念が根底から疑われている。
時間概念が変革したとしても、政治論理や経済理論には関係ない、とは言い切れなない。因果関係があいまいになり、近代合理主義哲学を根本的に再考する必要があるからだ。観測結果としての「データ」の客観性もあいまいになる。「データ」の客観性があいまいになれば、多数の観測者が、多数の「データ」を取得して、観測者相互の関係を調整しながら、「データ」の客観性を再構成する必要が生じるだろう。単純に言えば、政治家や学者の言うことを、「正しい」と信じる必要はないということだ。
観測者としての生活者の「データ」が、政治的決定や経済理論の妥当性を裏付けるのであって、その逆ではないことが、時間や空間の存在を信じる程度に、確実に思われるようになるだろう。
一人の政治家の言動を100万回、1億回コピーして配信したとしても、ネット社会は因果関係があいまいな世界で、確固とした時間や空間を信じる根拠はネット社会にはない。当然、事実関係があいまいになり、犯罪行為の基準もあいまいになる。あいまいではないのは、AIによる確信であって、AIの妄想とも付き合うことになる。観測者としての生活者の「データ」を、AIすなわちAIを支配する覇権国家や独占企業に売り渡したときに(少なくとも10億人以上の規模で)、ネット社会がリアルな現実となり、人類は終焉(しゅうえん)する。
もし言葉に意味や価値があるとすれば、感情表現としての言葉であって、政治家や学者の言説よりも、詩や物語のほうが、言語表現としてはずっと上等であるという、近代以前の文学論を受け入れよう。そして、デカルト以降の哲学は不必要になる。少なくとも、AIが人間の言語能力を超える時点で、言語や論理に依存する哲学者(ウィトゲンシュタイン以降の文学部哲学科の教授たち)は不必要になるだろう。
◆進化論の天地逆転
ポンチェンの宇宙論を読んでいて、進化論が気になった。
進化論は地球における生命の歴史を、理論的に説明している。地球が46億年前に誕生して、生命の歴史は38億年だ。宇宙論は、太陽が含まれる銀河(天の川)や、地球から一番近い別の銀河(アンドロメダ銀河)についての理論ではなく、全宇宙の何十億個の銀河の理論であって、宇宙の歴史はビッグバンから138億年と見積もられている。ガスの銀河が形成されてから、星の銀河になるまでの理論も整備されている。
米国の天文学者でポリマスのカール・セーガン(1934~96年)が、地球外生命が存在する確率を計算する気持ちがよくわかる。異なる銀河は、形や大きさがとても個性的だけれども、平均的な意味での化学組成はとても類似していることもわかっている。地球だけに生命が発生する確率は、ほぼゼロだ。それに加えて、進化の歴史において、遺伝コードが変化しない理由をどのように説明するのだろうか。宇宙論者は生命の進化には興味が無い。進化論者は宇宙の歴史を無視している。
おそらく、宇宙論者と進化論者のギャップをつなぐのは、ウイルスだ。ウイルスは細菌から動植物まで、すべての生物と共存・共生・共進化している。細胞の中で自己再生産するウイルスだけではなく、遺伝子に潜(ひそ)んでいたり、個体に感染するウイルス、それぞれに姿かたちを変化させたりする。
宇宙に漂(ただよ)うウイルスの存在を否定する根拠はない。ウイルスの存在が、もし宇宙規模であれば、遺伝コードが進化論的な時間では変化しないことも納得がいく。さらに、ウイルスは宇宙のエントロピーを減少させる効果があるかもしれない。
物質が作るエントロピーの増大と、ウイルスが作用するエントロピーの減少は、間違いなく物質の効果が大きいとしても、ウイルスの存在を無視できるほどに、物質によるエントロピー増大が大きいかどうかはよくわからない。エネルギーだけでイメージする古典的な世界と、エントロピーを加えた、実在する熱力学的な世界とでは、大きなギャップがある可能性が大きい。
中世から近代へのルネサンスでは、天動説から地動説への変革が、神の世界から人間中心主義へ移行する、象徴的な役割を果たした。近代の機械文明から、近未来のデータ文明へのルネサンスでは、宇宙における生命の存在と役割を考える、宇宙論的進化論が象徴的な役割になるかもしれない。
筆者が妄想する「ウイルスの論理」が、革新的な物理理論によって、人間の論理とは別次元の生命の「論理」となる可能性すらある。
本シリーズでも、ウイルス「データ」の網羅的解析(バイローム、virome)については何度か言及した(※参考3など)。「ウイルスの論理」が見えてくるためには、理論的な理解だけではなく、数億、数百億かもしれない多様なウイルスの「データ」が、全宇宙における銀河とブラックボックスの分布のように、観測されて可視化される必要がある。気の長い話だけれども、100年もあれば、不可能な話ではない。
◆データ化学の沃野
物理学や生物学の話が先行した。しかし、産業論としての本論の主眼は、データ文明における化学産業の再定義だ。近代の機械文明というと、蒸気機関やロボットなど、物理学や工学が主役であって、化学はわき役に過ぎないと思われがちだ。
しかし産業論としての化学は、エネルギーと素材、さらに医薬品まで、産業の主幹となる技術分野だ。微細加工技術を競っている半導体産業においても、超高純度シリコンの製造技術が出発点だった。最先端のスーパーコンピューターやAI技術においても、その産業応用は、量子化学による物性予測が重要な課題となっている。その化学産業が元気がないと感じるのは、筆者だけではないだろう。
製薬企業の多くは化学企業が母体だった。しかし、バイオテクノロジーの発展によって、製薬企業は化学産業というよりも、ベンチャー企業への投資ビジネスになっている。高分子化学が発展して、合成繊維が花形だった時代もあったけれども、現在の繊維産業は、医療機器へと研究開発をシフトしている。現在の化学産業は、必要不可欠ではあっても、成長点が見えない、雑居産業になってしまった。
産業活動を「生産」もしくは生産性だけで評価する時代は終わっている。経済は、生産よりも消費の影響力が大きくなり、地球資源からサービスまで「消費」能力が向上し、商品や金融が経済の主役になった。AI技術によって、情報や知識ですら、大量消費される時代になった。大規模言語モデル(LLM)では、ほぼすべての言語資源が「データ」化され、画像データと関連付けられて、消費されている。
言語と容易に関連付けることができない、新たな大量の「データ」を発掘しないと、AIの技術革新は急ブレーキがかかるだろう。組織された産業活動として、大量の化学「データ」を生産すること、その「データ」の用途を開発することができれば、化学会社が、データ文明における基幹産業となる道筋が見えてくる。
自動化された機器分析装置、例えば、ガスクロマトグラフ質量分析装置(GC/MS)を、自家用車のように量産・販売することは困難ではない。GC/MSの「データ」を、化学構造式(言語記号ではない)と関連付けることも可能だ。GC/MS「データ」は、通常、特定の化合物を同定して、定量する。ごくまれに、スポーツの薬物検査や、代謝異常のスクリーニングのために、数十個の化合物を一斉分析することもある。
筆者は、100~200個の体液中有機酸を網羅的に分析した経験もある。個人レベルのGC/MS「データ」であれば、食品や医療での用途開発が想像しやすい。GC/MS「データ」の、もっと野心的な応用では、組織レベルや社会レベル、国家レベルでの用途開発が考えられる。
例えば、国家レベルの犯罪防止では、麻薬取り締まり(原産国の特定)に使える。福井県水月湖(すいげつこ)の7万年に及ぶ定点観測(年縞〈ねんこう〉)を、GC/MS分析すれば、文字の記録が無い先史時代の歴史が、植生の変化(年稿の花粉分布)による平均的な気温変化以外にも、突発的な自然災害も含めて、詳細に理解できる可能性がある(※参考4,※参考5)。「データ」化学は、直接的な軍事力にはなりそうもないけれども、食糧や医療では、工夫次第で国家安全保障の切札になるかもしれない。
機械学習する化学「データ」の産業利用について、特許を出願することも容易に想定できる。自動化された機器分析装置としては、GC/MS以外にも多数ありうるし、バイロームに使うDNA/RNAシークエンサーも遺伝コードと関連付けられた化学「データ」だ。化学「データ」の産業利用を、産業活動として効率化して市場競争する、「データ」化学の基盤技術は機械学習であって、四半世紀(25年)以内には実現可能な、次世代AIビジネスとなるだろう。
化学産業の総合力において、EU(欧州連合)諸国と日本は、米国・中国などの物理・機械・軍事中心の覇権国家よりも、歴史的な蓄積と優位性がある。筆者の妄想のレベルではあるけれども、「データ」化学産業は、産業政策として、一考の価値はあると思われる。
「データ」化学の沃野(よくや)について、簡単な素描を開始した。その素描の中で、最も疑わしく、しかし筆者として画期的だと考えている素描は、組織レベル、社会レベル、国家レベルなど、個体集団の階層を、くりこみ(renormalization)もしくは入れ子(nested)な構造として理解しようとしている部分だ。
Renormalizationもnestedも、それぞれ量子電磁気学や統計学から借用した概念(専門用語)で、筆者としては違和感がある。巨大ブラックホールを含む銀河の構造というか、劇中劇(a play within a play)のほうが、個体差の理論としては実感に近い。生体であれば、細胞、臓器(組織)、個体、個体群といった階層構造について、階層と階層の境界部分に、場所に固有な個性を見いだす、といった感じだろうか。
「場所に固有な個性を見いだす」ための機械学習アルゴリズムを、フェノラーニング®と命名して、ビジネス展開を模索している。「データ」化学の沃野が、天の川程度には、ぼんやりと見えるようになることを期待して。
※参考1:『みんなで機械学習』第57回「遊びの技術思想」(2025年3月5日付)
https://www.newsyataimura.com/yamaguchi-138/#more-22135
※参考2:「重力がエントロピー起源」であることを示す革命的理論が発表
https://nazology.kusuguru.co.jp/archives/172825
※参考3:『WHAT^』第10回「漱石とこれからの時代」(2018年10月15日付)
https://www.newsyataimura.com/yamaguchi-139/#more-7809
※参考4:『週末農夫の剰余所与論』第25回「太古のデータ文明」(2022年3月22日付)
https://www.newsyataimura.com/yamaguchi-68/#more-12883
※参考5:年縞博物館(福井県)
https://varve-museum.pref.fukui.lg.jp/
--------------------------------------
『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)
コメントを残す