山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。
◆制作ノート
英国の経済学者エルンスト・シューマッハー(1911~1977年)の「スモール イズ ビューティフル」における中間技術の提案を、「みんなの機械学習」として実現するため、「スモール ランダムパターンズ アー ビューティフル」という拙稿を連載している。前稿では、新たに第4章「機械学習との共存・共生・共進化-まばらでゆらぐ多様性」を書き始めた。生態系が「まばら」であること、すなわち、生態系における共存・共生・共進化は、まばら(スパース)な関係によって非線形な複雑系が安定化しているという、データ論として都合のよい入り口を見つけた。データの世界は、ランダムな数の分布に意味がある世界だ。数学では、確率は実数によって定義されていても、コンピューターは、整数の疑似乱数しか作ることができない。疑似乱数であっても、ランダム行列にして、固有値(eigenvalue)分解すれば、実数(場合によって複素数)の世界に戻るので不思議だ。もちろん、コンピューターで計算しうる固有値は、整数でしかないけれども。こういう意味不明な話も、量子コンピューターでは、複素数の世界を実際に計算できてしまうので、本当に意味不明になる。「スモール ランダムパターンズ アー ビューティフル」は途中の画像以降なので、制作ノートに相当する前半部分は、飛ばし読みしてください。
「スモール ランダムパターンズ アー ビューティフル」のゴールは、結論を論理的に構築することではなく、生活世界において、データの世界との共存・共生・共進化に希望を実感することにある。近代的なモノの価値に従属する経済から、コト(サービスなど)の意味を重要視する経済への移行を時代背景として、近未来のデータサイエンス テクノロジー アンド アート(データの世界)が、人類の文明論的な変革をもたらす夢物語を、少なくともディストピアとはしない、複数の探索路を切り開こうとしている。物語のゴールにおいては、意味が認知される以前の「データ」そのものが、みんなの機械学習によって、「言語」とは別の、文明の道具になるだろう。
◆経済成長を折り畳む
バブル崩壊以降の日本経済は、「失われた30年」など、ネガティブに語られることが通常だ。バブル期には海外生活をしていて、世界で輝いていた(といわれる)日本経済を感じることは無く、バブル期以前の戦後経済では、父親が働き過ぎで、母親は生活の余裕がなかった筆者の経験では、日本経済にポジティブなイメージは全くない。奴隷経済や植民地経済は論外としても、戦後の輝いていた(といわれる)米国の自由主義経済や、米国と冷戦をしていた時代のソビエト連邦の計画経済のどちらであっても、権力と軍事力は立派だったけれども、人びとの生活は褒(ほ)められたものではないことを、旅行者として実際に目撃をしている。日本経済だけではなく、どのような過去の経済であっても、ポジティブなイメージはない。しかし、農耕以前の、市場経済すらない時代と比べたら、 物質的に豊かになり、医療や教育などの社会制度も充実したことは事実だろう。この事実と実感のギャップは、単に時間軸の差異だけではなく、人口密度や生活環境の差異が、複雑に交絡している。その意味では、日本経済は、人口が減少しながらも、生活しやすい環境が維持できているのだから、当面は及第点かもしれない。及第点の経済に、立派な文化が育てば、十分以上だろう。
経済の量的な成長に限界があることは、理論的にも歴史的にも明らかだ。経済の質的な成長は、必ずしも文化だけではなく、スポーツや娯楽かもしれない。文化が質的に成長する場合、非連続的な変化で重層化する。パイ皮は伸ばすだけではなく、折り畳んでまた伸ばすことで、非線形な質的な変化が現れる。物質の世界を折り畳むのは大変であっても、言語の世界やデータの世界であれば、エネルギーを使わずに折り畳むことができる。データの世界はどのようにしたら、折り畳むことができるのだろうか。現在のデータ解析は、線形変換であるため、折り畳むことはできない。しかし、フーリエ変換などによって、周波数の世界に移行すれば、位相を制御して反転させることができる。一般に、位相を制御した波を重ね合わせることで、エッジを抽出したり、折り畳んだりすることができるようになる。機械学習の代表的な手法である、ディープラーニングによる画像解析では、このような非線形な変換が効果的に用いられている。ディープラーニングは画像データだけではなく、大量の文字データも処理できる。データを折り畳んで、重層的なデータの機械学習が可能になり、意味不明なデータの世界を探索する準備が整いつつある。
◆技術と技術革新
近代以降、生活と経済の不確実性が増大している。市場経済では、取引価格の予測不可能性が、健全な取引の条件と考えられている。生活の大部分が市場経済の一部分となったことで、生活の不確実性が増大することは理解できる。自家用車や家電製品だけではなく、コンビニの加工食品、医薬品、さらには、教育・介護サービスにおけるインターネットの利用など、サービス産業も機械化されて、機械を使わない生活を想像することのほうが難しくなった。機械は技術製品であるため、技術革新が加速することも、生活の不確実性が増大する原因になっている。生活と経済に関連する技術は、大量生産が可能で、コストでも有利なデジタル技術へと、急速な技術革新が進んだ。電気自動車が、さらに生活技術のデジタル化を加速するだろう。サービス産業では、AI(人工知能)技術が、技術革新を加速している。筆者の見立てでは、今後はデジタル時間分解能のデータが、生活関連技術の技術革新を加速するだろう。それでは、生活環境は、ますます不確実になるのだろうか。その場合は、種としての人間の生存も不確実になりそうだ。恐竜の大絶滅のような、不連続な生態系の変化となっても、不思議ではない。
前稿では、経済オルタナティブデータが公共データとして整備されることで、生活と経済の予測可能性が向上するという、データ論的な折り畳みについて議論した。天気予報のように、生活予報や経済予報においても、予測可能性が向上することは、技術の進歩であって、現在の技術社会の延長でしかない。しかしその技術がもたらす社会変化は、データの所有権など、社会制度の根本的な変革が条件となり、不確実性の減少という、資本主義社会からの反転現象となって、不連続で非線形な社会変化を引き起こすことを想定している。単純化して考えると、AI技術などの技術革新のスピードを追い抜く、社会制度の変革を模索しようとしている。どこからどのように社会制度の変革が始まるのかということでは、筆者としては、健康データ、特に認知症関連の健康データが、公共データとして提供されて、介護保険や健康保険制度が抜本的に変化することを夢見て、本稿を執筆している。認知症の治療薬のように、技術革新のスピードが、社会の要望や期待に追いつかない課題では、生活や経済に関連する技術の技術革新によって、間接的な意味での、環境整備を優先するという選択肢が現実的になる。
◆技術の表現
特許は、産業活動のための新規な技術を保護すると同時に、技術思想を公開して、技術の発展を促(うなが)す仕組みでもある。特許を書いたり読んだりするのは、専門的で特殊な決まり事や、文字化されていない背景としての、利害関係への配慮があるので、弁理士の業務と考えられているかもしれない。しかし、特許は無料で公開されている公共データでもある。大量の特許情報を機械学習すれば、技術の現状と問題点を俯瞰(ふかん)できる。いわゆる、パテントマップを自動生成するAI技術だ。リアルタイムに技術の変化をモニタリングすることで、ある程度、新規技術の方向性も予測できるだろう。もちろん、新たな技術思想にもとづく、本質的に新しい発見や発明は、不連続に発現して、パテントマップで予測できる範囲外となる。
生活や経済に関連する技術の場合、画期的なイノベーションであっても、破壊的なイノベーションが受け入れられる余地は少ないはずだ。破壊的イノベーションの関連技術が広く受け入れられるためには、時間がかかるだろう。技術思想のレベルで考えると、いわゆるパラダイムシフト、物事の見方が変わることが先行して、しだいに具体的な技術に肉付けされてくると考えられる。本稿の文脈では、パラダイムを「表現」として、物事の見方(認知)よりも能動的にとらえている。物事の見方・考え方ではなく、その見方・考え方を、いかに表現するのかということを考えている。アナログ技術からデジタル技術への変化は、パラダイムシフトに相当する。本稿は、デジタル時間分解能のデータを使って、生活や経済に関連する「技術の表現」を読み取ろうという試みだ。
技術思想の表現を、技術の表現や、データの表現と読み替えてみよう。生活や経済に関連する技術の場合は、そのような読み替えに、無理が少ないと仮定している。データ論の文脈では、データの解析よりもはるかに早い段階で、データの収集・測定に関連する技術において、技術の表現が、データに織り込まれる。例えば健康データの場合、個体差(性別、年齢、身体部位など)を評価しうる3D画像データによって、網羅的に病態診断するようなイメージだ。遺伝子データの場合は、ゲノム情報(DNA配列)では年齢を評価できないので、エピゲノム情報(DNAの後天的な化学修飾)を網羅的な健康データと考えるといった具合になる。生活や経済に関連するデータの場合、どのようなデータが網羅的データであって、どのような技術で網羅的データを収集・測定するのだろうか。
◆同時多点測定
生活や経済に関連するデータは、何を表現しているのだろうか。経済データの場合は、経済的な価値を「貨幣」で測定する技術が重要なので、「貨幣」の動きが表現されていると考えてみよう。貨幣の動きを網羅的にとらえる場合、銀行のようにマクロな視点と、eコマースのようなミクロなデータを大量に収集する場合が代表的だ。その中間の、企業の経理や税務のデータは、一部分公開されるけれども、リアルタイムで収集・公開されることはない。上場企業では、企業の経済的価値が、株価として、リアルタイムに評価されている。株価の変動は、マクロ経済データや、ミクロ経済データによって影響を受けるけれども、単純には予測できない。もし、株価の変動を予測する、網羅的な経済オルタナティブデータがあると仮定すれば、その予測法によって、株式を上場していない多くの中小企業の企業価値も、ある程度、例えば業界レベルで、予測可能になるはずだ。前稿で紹介した、アイデア段階の経済オルタナティブデータでは、電磁波(ビルの光を含む)データや、事業所からのゴミ処理データが、株価予測に使えそうだ。
デジタル時間分解能のデータを測定する場合、同時多点測定によって意味あるデータとなる可能性があるので、複数の場所での同期シグナルの正確性が技術的な課題となる。同期シグナルを予測して補正する技術は、予測制御の基盤技術となるだろう。同期シグナルは「場所」に依存しないデータで、その他の、場所に依存するデータを補正する。集団レベルでの生活および経済データでは、集団として活動する「場所」の表現が重要であって、場所をデータから推定できることが、網羅的データの条件になる。サイバー空間での同時多点測定の技術は、より現代的な場所の表現となるはずだけれども、別の文脈で再考してみたい。
「場所」の表現は、単純な空間的な位置(3次元的な意味も含めて)だけではなく、場所の内部の個体密度や、境界における移動(出入り)、内部と外部の非対称性など、集団活動の個体差を特徴づける。おそらく最も重要な「場所」の表現は、「場所」の機能であって、集団活動の役割や目的に直接的に関係してくる。オフィスビルや工場などの「場所」の機能は、ほぼ自明で、電磁波(ビルの光を含む)データや、事業所からのゴミ処理データによって、ある程度、集団活動の機能的な側面を推定できる。生活データにおける場所の機能は、スラム街や難民キャンプは極端な例としても、経済的な格差と、防犯の意味でのセキュリティーが重要だ。都市部の場所の機能と、田園地帯の場所の機能では、場所の表現が大きく異なるので、「風景」として、個人の認知機能の中に織り込まれることになる。最近の景観に関する技術の話題では、実際の景観を再現するバーチャルな3Dモデルをインターネットで公開して、都市開発を促進したり、観光資源とすることが試みられたりしている。こういったモデルに、実際の人の流れがリアルタイムに反映されたら、生活や経済に関連するデータを、そのような仮想空間から読み取ることができるかもしれない。
◆まばらで多様な技術思想
AI技術の技術思想は、近代以降の、産業革命の技術思想の延長上だろう。もう少し正確には、デジタル化した産業社会の技術思想だ。経済的な独占と、政治的な独裁の区別を無視すれば、強い競争社会において、最強の軍事技術を頂点とする技術思想の中核部分となっている。一方で、競争社会から落ちこぼれた人びとや、多様で豊かな文化的活動を支える人びとには、AI技術は敵対的もしくは無関係なのだろうか。データの収集と解析を、個人レベルで可能とするような社会制度がありうるのであれば、デジタル化した産業社会の技術思想を折り畳んで、裏と表が反転したAI技術が、新しいデータ文明として発展する可能性があるはずだ。生産や消費を重要視する産業社会は、政治的な限界により、すでに持続可能ではなくなっている。環境や社会の問題を解決するために、データの収集と解析を重要視する社会への移行が、産業社会が存続する条件でもある。表と裏、どちらの技術を優先すべきか、自明だろう。
技術が過剰(必要以上)に進歩すると、技術は自然に畳み込まれる。AI技術で、株価が予測できるのに、そのアルゴリズムで、中小企業の経済活動を測定しようと試みる場合、儲けるだけなら不必要だし、その試みが成功すると、せっかくの株価予測が思わぬ影響を受けるかもしれない。しかし、技術として考えれば、最初の株価予測が不十分であっても、産業構造全体からのフィードバックデータによって、予測アルゴリズムを漸近(ぜんきん)的に修正できるので、予測技術の進歩は加速される。生活や経済に関連するデータから、場所の表現を読み取る(推定する)場合、場所の脆弱(ぜいじゃく)性も読み取って、逃げ道をあらかじめ探しておくのもよいだろう。最適解だけを探して、競争に勝とうとしても、状況が大きく変われば、予測は当たらなくなる。状況のランダムな変化も考慮して、必ずしも最適ではなくても、より安全で確実な方法を模索することも必要だ。技術思想の進歩は、生態系の進化のようなもので、まばらで多様な技術との、共存・共生・共進化が不可欠なはずだ。AI技術も例外ではない。
シソ無農薬栽培 バッタ、アマガエル、カマキリが隠れている 筆者撮影 2023年8月30日
『スモール ランダムパターンズ アー ビューティフル』
1 はじめに; 千個の難題と、千×千×千×千(ビリオン)個の可能性
1.1 個体差すなわち個体内変動と個体間変動が交絡した状態
1.2 組織の集合知は機械学習できるのか
1.3 私たちは機械から学習できるのか
2 データにとっての技術と自然
2.1 アートからテクノロジーヘ
2.2 テクノロジーからサイエンス アンド テクノロジーへ
2.3 データサイエンス テクノロジー アンド アート
2.4 データサイクル
2.5 データベクトル
2.6 局所かつ周辺のベクトル場としてのデータとシミュレーション
3 機械学習の学習
3.1 解析用データベース
3.2 先回りした機械学習
3.3 職業からの自由と社会
3.4 認知機能の機械学習とデジタルセラピューティクス(DTx)
3.5 学習は境界領域の積分的探索-ニッチ&エッジの学習理論
3.6 機械学習との学習
4 機械学習との共存・共生・共進化-まばらでゆらぐ多様性(前稿)
4.1 生活と経済の不確実性(前稿)
4.2 生活と経済に関連する技術は、何を表現しているのか(本稿)
生活と経済は単純な関係ではなく、複雑に交絡している。特に、集団としての生活、例えば家族と、集団としての経済、例えば勤務する会社の関係は、それぞれが動的に変化するし、マクロやミクロな視点でのスケール依存性も全く異質だ。しかし、生活と経済に関連する技術について、その技術に関連するデータを網羅的に収集・測定すれば、そのデータが表現している意味を読み解くことができるだろう。集団としての生活と経済が、何を表現しているのか、そもそも表現するような主体を見いだせるのかも不明だ。しかし、集団が共有する「場所」が存在するし、その場所の個性が、集団の個性と重なる。さらに、近代以降の生活と経済が、機械や技術によって条件づけられるようになって、生活と経済に関連する技術思想であれば、何を表現しているのかを問うことは可能と思われる。技術はデータによって評価されるので、生活と経済に関連するデータから、「場所」を推定し、場所の機能や、場所からの逃げ道など、場所を接点として、データに関連するが技術が、何を表現しているのか読み解いてゆく。このような推論の連鎖は、実務としては、機械学習により自動化されたデータマネジメントのプロセスに相当する。A社の株価の変動を予測する場合に、地理的な予測因子と、業界的な予測因子を調べて、さらにA社のイノベーションへの期待値と、リスクマネジメント(事業環境の変化への対処)など、株価の不確実性(予測困難性)をオルタナティブデータで評価(不確実性に関連する因子を推定)するといった具合だ。
大企業の株価の予測因子は、関連する中小企業の経済活動を評価する予測因子でもあるので、中小企業の地理的な経済予測と、業界的な経済予測を計算して、マクロ経済データとの差異をくりかえし計算で調整することも可能だろう。こういった、ミクロ経済とマクロ経済の中間的な方法の利点は、地域や業界のスケールを変化させて評価できることで、計算パワーが十分にあれば、リアルタイムでの評価も可能になる。天気予報のイメージで考えれば、分かりやすいだろう。データ資本主義において、データを独占することの価値ではなく、データによる経済予測が正確になることの価値が正当に評価されるようになれば、地域や業界を限定した経済予測で十分なので、資本主義社会が、国家による覇権や、巨大企業による独占とは別の、未来への成長経路を見いだすことになる。
しだいに正確になる経済予報が、社会を変革する程度よりも、正確な生活予報のインパクトは大きくて、文明論的な変革となるだろう。近代文明は、物質的な豊かさを求めて、地球環境を破壊してしまった。さらに、近代文明は、地球の生態系において、生命相互の関係を全く理解できなかったので、生命相互の関係から見た人びとの生活は、極度に不健康で貧しいものになっている。縄文人の知恵から学ぶことができないのは残念だけれども、未開文明の先住民の知恵から学ぶことが多いのは確かだ。しかし、ニュートン以降の、近代科学の成功体験(パラダイム)から、簡単には脱却できない。おそらく、量子力学と量子コンピューターで、必要以上にもっと先に進んで、意味不明の世界から、新しいパラダイムを発見するしかない。数学のイメージで表現すると、論理と論証を重要視する近代文明の微分的な見方から、微分不可能な関数でも、集合論的な測度論で積分可能にして、さらに乱数を使った確率積分で計算可能にした現代数学の成果を、より身近に感じることができるような新しいパラダイムを求めている。
どのような生活予報が求められているのだろうか。最近のニュースでは、災害のリスクに応じて、火災保険などの保険料率が調整されるそうだ。日本では、犯罪のリスクには連動しないようだけれども、英国での生活経験では、保険料の内容を精査すると、その地域の安全性が、かなり精密に評価されていた。犯罪予報としては、特にネット犯罪を予測することができれば、逆トロイの木馬作戦で、犯罪の手口を詳細に記録して、犯人検挙に役立つだろう。ネット犯罪のように、技術的に巧妙な犯罪の場合は、防止対策を考えるよりも、犯罪者ネットワークを逆探知して、中枢部を機能できないように破壊するほうが効率が良い。特にネット金融における犯罪摘発は、サービスを提供する銀行の責任であって、犯罪被害者も、国家の仕組みとして、銀行が救済すべきだろう。製薬業界では、薬害の救済に責任を持っている。銀行業界としては、警察にネット犯罪に関する情報提供をするための、大規模な技術投資を行ってもらいたい。少なくとも犯罪者集団には負けない投資規模を確保して、存在感を示し、技術投資の成果も回収する作戦だ。。
AI技術を使ったテロ対策は、すでに実用化され、学習データに含まれる、犯人像の人種的バイアスなど、問題点も指摘されている。もっとポジティブな意味での生活予報について考えてみると、生活情報を共有する家族などの小集団におけるAI技術の活用は、未開拓領域であることに気がついた。例えば、高齢者や学童の見守りサービスの場合、スケールを地域に拡大するための公共的なデータサービスとの連携はない。個人や商店などを特定するのではなく、生活関連の地域サービスを「予報」として、不特定多数に提供するイメージだ。家族や集落といった、比較的安定な社会構造が機能しなくなり、その場かぎりの群衆やSNS(ソーシャル・ネットワーキング・サービス)でのつながりでは、「予報」できる生活関連の地域サービスを想像することは困難だ。そうこうするうちに、貧困、ひきこもり、認知症、いじめ、薬物乱用など、機能不全の家族のカケラでは支えきれない社会問題が山積みとなり、COVID-19のような感染症パンデミックまで発生した。生活予報の必要性は確実に増大している。
地域における人びとのつながりを、まばらでゆらぐ多様性のなかに取り戻すために、地域の自然環境における「まばらでゆらぐ多様性」を、再発見することから始めたい。地域の風環境を、同時多点測定すると、何が発見できるだろうか。風の変化が相関する地域を描画できたとして、そのエリアの形は、季節によって変動するだろう。季節の推移は、地域内でゆらいでいるかもしれない。都会ではビル風の影響が、地方では川風の影響が、離れた地域で見いだされるかもしれない。意味のない発見かもしれないけれども、地域における「まばらでゆらぐ多様性」を発見するという試みは、地域における人びとのつながりを、未来志向に再定義してゆくだろう。住みやすい地域のすがた(風景)は、人びとの、まばらでゆらぐ多様なつながりが、地域の自然環境に支えられている、多様な風景なのだと思う。もちろん、まばらでゆらぐ多様な自然環境は、風環境に限らない。樹木のネットワーク、野鳥のさえずり、土壌生物の多様性、身近な季節の変化が感じられる全ての自然環境において、技術的にデータ取得が容易な自然環境について考えてみよう。その試みの中から、未来の生活予報が生まれるだろう。
◆次回以降の予定
4.3 スモール データ アプローチ-個体差のまばらでゆらぐ多様性
4.4 まばらでゆらぐ多様性の過去・現在・未来
4.5 生活の不確実性を予測する
4.6 弱い最適化-脆弱性/反脆弱性からのスタート
4.7 ひとつのビッグ予測、たくさんのスモール適応
--------------------------------------
『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。
コメントを残す