п»ї 認知機能の機械学習とデジタルセラピューティクス 『みんなで機械学習』第23回 | ニュース屋台村

認知機能の機械学習とデジタルセラピューティクス
『みんなで機械学習』第23回

6月 19日 2023年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

◆制作ノート

英国の経済学者エルンスト・シューマッハー(1911~1977年)の「スモール イズ ビューティフル」における中間技術の提案を、「みんなの機械学習」として実現するため、「スモール ランダムパターンズ アー ビューティフル」という拙稿を連載している。前稿では、AI(人工知能)技術によって変質する職業を、日本国政府が推進する「ソサエティー5.0」の視点から、近代における分業を批判的に検討してみた。「スモール ランダムパターンズ アー ビューティフル」は途中の画像以降なので、制作ノートに相当する前半部分は、飛ばし読みしてください。

「スモール ランダムパターンズ アー ビューティフル」のゴールは、結論を論理的に構築することではなく、生活世界において、データの世界との共存・共生・共進化に希望を実感することにある。近代的なモノの価値を問う経済から、コト(サービスなど)の意味を重要視する経済への移行を時代背景として、近未来のデータサイエンス テクノロジー アンド アート(データの世界)が、人類の文明論的な変革をもたらす夢物語を、少なくともディストピアとはしない、複数の探索路を切り開こうとしている。物語のゴールにおいては、意味が認知される以前の「データ」そのものが、みんなの機械学習によって、「言語」とは別の、文明の道具になるだろう。

AIとの共存・共生・共進化は共和主義なのか

公共性を訴求する共和主義は、歴史的には複雑な政治的立場をとっているけれども、個人的な倫理観を重要視するという意味では、保守的な思想とみなしうる。筆者が考究しているAI(人工知能)との共存・共生・共進化は、人間中心を明確に拒否しているという意味で、AIとの民主主義というよりも、AIとの共和主義というほうが近いかもしれない。民主主義の場合は、AIにも法的なAI人格を認めるかどうか、民主主義的に議論することになりそうだ。共和主義の場合は、AIに人格や主権を認める必要はなく、AIの動作が倫理的であればよい。AIとの共存・共生・共進化は、少なくとも専制主義(権威主義)であってはならない。人間の能力を超えるAIが、専制君主となることが確実であって、そのような社会は、実際は人間が作り出した社会的課題を解決する能力がないことが確実だからだ。AIにとって、人間が作り出した社会的課題を解決するためには、人間を絶滅させることが最も合理的な解決案だろう。別の言い方をすれば、AIには、哲学的な意味での、反省能力は無い。もし反省能力があったとしても、人間以上の反省能力を得るためには、人間以上の失敗を積み重ねる必要があって、人間にもAIにも未来は無くなる。

AIとの共存・共生・共進化は、公共的な政府機能を拡充させるけれども、効率の良いAIに公共的な仕事の大部分を任せるという構想を描いている。ひとびとは、過去の人間が作り出した問題を、自分の問題として反省し、解決策を模索する役割だ。歴史的に見て、人間の暴力性が明確になったのは、アウシュビッツとヒロシマであって、疑いようがなく明証的だ。デカルトの時代には想像もできなかったかもしれないけれども、ある程度、スピノザやライプニッツは危惧(きぐ)していて、人間中心の合理性に、宗教(または倫理)による歯止めを要求していた。デカルトが求めた明晰(めいせき)性には、公共性は考慮されていない。「我思う故に大量殺りくの未来在り」は、論理的に明晰であったとしても、予測可能ではなかった。AI兵器による殺りくが、デカルトの思想の延長上にあることも言うまでもない。

AI分野で日本が先回りするシナリオ

本稿は文明論的な視野で考えているため、政治との接点は少ない。しかし、中国政府のAI推進政策を見ていると、経済政策というよりも、社会の変質への無自覚が、近未来の人類への巨大なリスクと言わざるを得ない。しかも、中国は世界最大の認知症大国でもある。チャイナリスクは、すでに米国が過剰な反応を示し、全世界を不安定化している。中国政府自身は気が付いていないようだけれども、中国政府にとって最善のシナリオは、AI技術で認知症を克服することのはずだ。このシナリオは、中国政府とは全く無縁に、筆者が開発している機械学習法、フェノラーニング®のビジネスゴールでもある。本稿の制作ノートでは、本題から脱線して、AI技術において、日本政府が中国政府に先回りするシナリオを考えてみよう。ところで、上記の文章において、中国を日本と言い換えても(チャイナリスクはそのままで)、チャットGPTレベルでは意味のある文章といわれるかもしれない。

「第五世代コンピュータシステムプロジェクト」(5Gプロジェクト)は,1982~92年の11年間にわたり,国家予算約500億円を投じて遂行された、人工知能研究プロジェクトだ。30年以上前の500億円は、現在の価値に換算すれば、1000億円以上であることは確実だし、当時はベンチャーキャピタルのような資本政策をしない、真水の税金だったので、まさに産業の成長戦略をになうナショナルプロジェクトだった。5Gプロジェクトが、現在のAIブームとは無縁の研究成果であるとすれば、日本の成長戦略が行き詰まったのも無理もない。5Gプロジェクトは高度な技術的プロジェクトで、有識者が様々に議論してきたけれども、筆者が本稿で、AI技術の近未来に先回りするシナリオを考えていて、(本来の文脈であるフェノラーニング®技術ではなく)5Gプロジェクトを再利用するアイデアが浮かんだ。フェノラーニング®は筆者の職業人生のライフワークであって、5Gプロジェクトは多額の予算を投入した国家プロジェクトだ。どちらのシナリオのほうが現実味があるのかということではなく、そのシナジーに興味を持った。

アイデアは単純だ。5Gプロジェクトは知識ベースと推論エンジンの組み合わせで、高度な数学的な定理の自動証明に取り組んでいた。現在のチャットGPTのようなAI技術を使えば、「あやしげな」知識ベースを大量に生成することができる。5Gプロジェクトの技術を使えば、データマネジメント業務でいうロジカルチェックを自動化できる可能性があり、「あやしげな」知識ベースの論理的な整合性を、信頼できるレベルまで自動的にクリーンアップすることを思いついた。ロジカルチェックは定理の自動証明よりも、はるかに単純な論理操作なのだけれども、多様な「不整合」のパターンがあるため、推論エンジンだけではなく、機械学習も組み合わせる必要がある。5Gプロジェクトの論理プログラミングを応用して、信頼できる知識ベースを自動的に構築する技術となる。知識ベースは検証するために公開することもできるし、著作権で保護もできる。5Gプロジェクトの論理プログラミングは専門家の領域であるため、中小企業のための「みんなで機械学習」というわけにはいかないけれども、国家レベルでの成長戦略には寄与するだろう。

◆認知機能の機械学習

論理的な推論能力は、重要な認知機能であっても、認知機能の全てではない。認知症においては、ゲームの理解力などの形で、論理的な推論機能も診断に使われる場合もある。しかし、記憶機能の障害のほうが臨床的には重要な問題となる。認知症の臨床症状を、総合的なスコアーとして診断する方法は医学的に確立されている。しかしその臨床スコアーは、脳の認知機能を測定しているかどうか不明だし、脳の認知機能が十分に解明されているわけでもない。知能指数(IQ)が知能を測定しているのかどうか、難しい議論はたくさんあったとしても、教育現場で、役に立つ範囲で使われている。認知症の臨床スコアーは、IQと似た事情なのだろう。こういう状況で、機械学習法によってIQや認知症の臨床スコアーを推定しても、あまり役立つものになるとは思えない。

そもそも多次元的で、個体差が大きい認知機能や知能などを評価しようとする場合、個人ごとに評価スケールを最適化して、その局所的な座標軸の個体差を評価することが考えられる。この単純なアプローチによって、評価スケールが類似する個人は比較が可能になる。評価スケールがかなり異なる場合でも、類似する評価スケールをうまくつなぎ合わせれば、評価スケールのネットワークのようなものができて、相互の位置関係は確認できるようになる。このような、局所座標系のネットワークを構築するためには、多数の個人と、大量のデータが必要になり、そのデータ処理に機械学習法が応用できる。ネット販売におけるリコメンド機能などにおいて、階層的クラスタリングなどの手法で、すでに実用化されている技術を、多少抽象的に説明しただけのことで、あまり新鮮味はないかもしれない。筆者が開発しているフェノラーニング®もこういった手法の仲間で、性差・年齢・場所(身体)などの表現型に注目して工夫したものだ。特に、場所(身体)の取り扱いが、認知症などの加齢とともに発症率が高まる慢性疾患の治療において重要になる。

◆デジタルセラピューティクス

スマホを、医療機器として医療現場で利用するデジタルセラピューティクス(DTx)をご存じだろうか。薬事承認を得て、医師が患者に処方するため、健康な方々には縁が薄いかもしれない。日本においても、禁煙DTxなど、すでに様々な製品が承認されている。筆者の友人が開発している「てんかん」DTxなど、適応疾患が急速に増加することは間違いない。もちろん、認知症DTxも複数開発されているはずだ。DTx製品が増えれば、麻酔科医や放射線科医のようにDTx専門医が必要となり、DTx専門薬局もできるかもしれない。しかし過度の期待はできない。そもそも、医薬品で十分であればDTxは不必要だし、DTxによって医薬品が不必要になったという話も聞かない。医薬品もDTxも、相応のメリットはあるけれども、不十分だということだ。筆者に言わせれば、診断と治療における「個体差」の問題に正面から取り組めば、医薬品もDTxも、格段に良いものとなるだろう。

「個体差」の問題とは、近代哲学におけるスピノザやライプニッツが後世に残した問題だ。「個体差」の問題は、データサイエンスの問題として、本格的に取り組むべき多くの社会的課題とも関連している。機械学習を「個体差」の問題に応用する場合、単純に言えば、治療法が進歩するという良いことだけではなく、予測不能な社会におけるリスクが増大し、進歩自体が意味不明で説明不可能になることも想定しておく必要がある。DTxが利用するデータ量が、ある閾(いき)値を超えると、データがデータを生成(シミュレート)するようになり、予測不能な変化が起こりやすくなる。例えば、脳波DTxが実現すると、人間では説明できない脳機能が測定可能になるかもしれない。技術の進歩は止められないので、有効な規制や社会変革を間に合わせるためには、先回りするしかない。

◆矛盾や欠損を含むデータの世界の論理

操作ミスや測定誤差の問題があるにしても、それぞれのデータは「事実」であって、全体から見ると外れ値であっても、単純に除外する根拠はない。さらに、データ相互の関係には、矛盾や欠損(不具合)が伴(ともな)う。デカルトや近代の基礎づけ主義では、確実な知識だけを蓄積して、論理的に整合する体系を作り、疑わしい経験的事実は採用しない。こういった合理主義は、紙による記録に頼るしかない時代の経済的な要請であって、真実を探求する唯一の方法とは言い難い。実際問題としても、数学における基礎づけ主義や形式主義は、限定的な成功しかもたらさなかった。数学の進歩の多くは、疑わしい「予想」を思いつくことから始まり、リーマン予想のように、コンピューターで調べることができる範囲では、反例が見つからないけれども、厳密な論理的証明ができない「仮説」はたくさんある。現時点では、リーマン仮説が成り立つ数学的世界と、リーマン仮説が成り立たない数学的世界の両方が、数学的には合理的としか言いようがない。量子力学の世界はもっと不可解な世界で、数学的には明確に定式化できて、実験事実とも一致するけれども、合理的な解釈ができない、もしくは無限個の合理的な解釈を許容する世界で、人間の言語能力の範囲では意味不明な世界だ。

本論では、30~40年前の「第五世代コンピュータシステムプロジェクト」の成果を、最近の機械学習に応用することを提案した。厳密な論理操作を、どの程度、どのように緩めるのか、簡単なようで難しい課題だろう。しかし、論理能力のない現在主流の機械学習よりは、多少でも論理的な機械学習のほうが理解しやすいことも確実だ。現在、「多少でも論理的」というと、統計的な論理、特にベイズ統計の論理を中心に機械学習に実装されている。しかし、統計的な論理は、論理学や数学の「論理」とは別物で、せいぜい確率的な意味しかない。確率的な意味は、量子力学を学べばよくわかるように、意味不明でもある。量子や超越数などの実数は、完全な乱数の世界を知っているようだけれども、人間は疑似乱数しか知らない。それでも論理を知らないAIが、矛盾や欠損を含む大量の知識ベースを生成しうることは確実なので、日本が先回りするシナリオとしては、論理プログラミングで、その知識ベースをロジカルチェックする提案だ。ロジカルチェックは、データマネジメント業務の業界用語で、実行可能な提案である。AIが生成する知識ベースとして、DTxで収集する大量のデータを使って、認知機能を機械学習した知識ベースを想定すれば、2重に先回りすることができる。例えば、電子臭覚システムのデータをDTxとすることなどを考えているけれども、相応の研究予算が無ければ、先には進めない。

中国との関係で、デリスキングという言葉がはやっているらしい。中国のリスクは、外交的なリスクのレベルではなく、近未来のAI社会がディストピアとなる絶望的なリスクだ。外交的な言葉遊びはチャットGPTに任せておいて、ひとびとは意味不明なデータから学んで、認知症DTxや防災科学、食料政策など、中国リスクに先回りするシナリオを考えよう。まずは、かなりの量の、網羅的で良質なデータが必要だ。例えば、各戸の食品備蓄量をデータとして収集して、メッシュ統計に表現することを考える。食品備蓄用のレトルトパックに、ICタグを張り付けて、テレビのデータ通信やスマホでデータ収集するなど、多数のアイデアが集まるだろう。多数の社会実装実験を行って、実効性のある政策を決定する。ひとびとにリスキリングを求める政治家自身のデジタルリテラシーは、SNSフォロワー数を競うか、チャットGPTで遊んでいる程度だ。そのようなリーダーシップすら果たせない政治家には退場してもらうしかない。外交や戦争ではなく、内政においてデータ環境を整備して、政治の世界にデータサイエンスを即刻導入する必要がある。今回の制作ノートは、AIディストピアを考える番外編となってしまった。AIディストピアを防止するために、デジタルポリティックスは待ったなしだ。

栃木県那須町の雲 2023年5月31日 筆者撮影

『スモール ランダムパターンズ アー ビューティフル』

1   はじめに; 千個の難題と、千×千×千×千(ビリオン)個の可能性

1.1 個体差すなわち個体内変動と個体間変動が交絡した状態

1.2 組織の集合知は機械学習できるのか

1.3      私たちは機械から学習できるのか

2   データにとっての技術と自然

2.1 アートからテクノロジーヘ

2.2 テクノロジーからサイエンス アンド テクノロジーへ

2.3 データサイエンス テクノロジー アンド アート

2.4 データサイクル

2.5 データベクトル

2.6 局所かつ周辺のベクトル場としてのデータとシミュレーション

3  機械学習の学習

3.1 解析用データベース

3.2 先回りした機械学習

3.3 職業からの自由と社会(前稿)

3.4 認知機能の機械学習とデジタルセラピューティクス(DTx) (本稿)

デジタルセラピューティクス(DTx)は、スマホのアプリを、医師が患者の治療のために「処方」する、SaMD(Software as a Medical Device)の一種だ。ベンチャー企業や医療機器メーカーだけではなく、研究開発型医薬品メーカーも参入している。高価なバイオ医薬品の新薬開発競争が続いているけれども、抗生物質や循環器系疾患の治療薬など、医療ニーズがあっても新薬開発がストップしてしまった疾患領域もある。合成化学の医薬品は、製造コストは安価であっても、開発のリスクが大きく、患者数が少ない場合や、複雑な疾患の場合は、開発費を回収できなくなっているのが現状だ。そこで、DTxと組み合わせて、既存の医薬品をより効果的に処方したり、新薬の開発を容易にすることを、製薬企業としては大いに期待している。そのように説明すれば、患者にとっては、DTxに大きな期待はできないことも明らかだろう。

しかし、デジタル技術は急速に進歩している。特に、その時間分解能は、人間の感覚能力をはるかに超えている。遺伝子解析技術の進歩によって、バイオ医薬品が可能になり、遺伝子データを使って、西洋医学の病理体系も修正されつつある。解剖学によって体系化され、X線やMRIなどの画像診断技術によって精密化されている西洋医学の病理体系は、依然として人間の感覚能力の範囲内にあり、臨床医は言語能力の範囲内で仕事をしている。しかし、ナノ秒(10-9秒)やピコ秒(10-12秒)のオーダーで、生体機能が正常か異常か、健康か病気かを問われるとすれば、デジタル技術によって測定が可能であったとしても、人間が経験しうる感覚能力の範囲外の現象であって、数字で表現できても、言語では意味不明としか言いようがなくなる。実際に脳神経の局所や、薬物と受容体の結合部位で起こっている現象は、ナノ秒やピコ秒のオーダーであって、統計的な集団作用のレベルで、ミリ秒やマイクロ秒の、感覚できる時間分解能となる。DTxの可能性は未来に開かれている。時間分解能が高くなれば、統計的な膨大な量のデータを、直接取り扱う必要が生じる。近未来のDTxでは、データを機械学習した後に、医師や患者が理解できる言語表現に変換されるようになるだろう。DTxではなく、通常の医療機器ではあるけれども、ピコ秒レーザーはシミ取りで医療応用されているので、身近な話題でもある。

認知症DTxも多数開発されているはずだ。しかし、筆者の知る限り、いまだ薬事承認された認知症DTxは無い。米バイオジェンとエーザイが開発するアルツハイマー病治療薬「レカネマブ」は、脳内に蓄積する「アミロイドベータ」という変性たんぱく質を除去するバイオ医薬品だ。米国製薬企業において、筆者が所属していたグループでは、20年ほど前に、脳内の「アミロイドベータ」をPET(陽電子放出撮影法)で画像化する技術を開発していた。その技術が、日常診療でも使われるようになり、バイオ医薬品の開発に役だった。アミロイドPET検査とその他の検査(例えば脳波など)を組合せて、脳内の問題の部位が正確に同定できれば、ピコ秒レーザーのシミ取り技術が、脳の老人斑(はん)にも応用できるかもしれない。認知症DTxは、単独の技術というよりも、治療法を最適化するために、複数のデジタル技術を、ロボティックスと機械学習によって組み合わせる技術となるだろう。デジタル技術の時間分解能には、多くの技術を組み合わせる余裕がある。

認知症は脳の認知機能の障害というよりも、脳の様々な高次機能の障害が、認知症という臨床症状を示す疾患と理解すべきだ。脳の高次機能といっても、記憶や推論など様々で、言語能力や感情の制御、場所の知覚など、臨床症状も多種多様だ。脳科学は急速に進歩しているけれども、脳の高次機能を表現する言語が、脳神経細胞の実際の機能に追いつかないように思われる。例えば、短期記憶と長期記憶では、記憶の意味やメカニズムが異なり、実際には何百種類の「記憶」があったとしても驚かない。そこで、脳の高次機能を機械学習することを考えてみよう。脳の高次機能といっているのは、感覚などのデータ入力と、運動制御などのデータ出力をつなぐ、その中間のデータ処理の全ての機能に相当する。例えば、第3次AIブームの引き金となったディープラーニングは、画像入力と人間的な判断(言語で表現される)をつなぐ機械学習技術だ。実際は、画像入力に限らず、音声や言語入力であっても、上手に機械学習することができる。出力も「判断」だけではなく、画像や文章を出力することもできるようになった。チャットGPT以降のAIブームを、第4次AIブームということもあるらしい。

本稿で筆者が展開している、AI技術を再発掘するひとつのテーマが、ディープラーニングは解析用データセットの自動作成技術ということだ。従来は、データをデータベースに集積し、データベースから解析用データセットを作成して、データ解析を行っていた。コンピューターにプログラムによって指示を与えるのが、筆者が50年続けてきた仕事だ。大学時代は、コンピューターの機械語でプログラムを作っていた。もちろん、ディープラーニングもプログラムによって動作しているし、プログラムとしてコンピューターに適切な指示を与える必要がある。しかし、ディープラーニングが解析用データセットを作成するための膨大な数のパラメーターは、ディープラーニングが膨大な数のデータから学習して、膨大な計算をして最適化する。膨大なデータが必要なだけではなく、AI専用スーパーコンピュータにおいて、膨大な記憶容量と、学習には1週間を超える計算時間が要求される、特殊な世界だ。筆者としては、もっとエレガントな機械学習を工夫して、中小企業の経済活動を支援するための、「みんなで機械学習」を模索している。その趣旨からは外れるけれども、小さな番外編として、世界のAIブームを先回りするアイデアを紹介したい。

デカルト、スピノザに続く、近代合理主義哲学の3番バッターであるライプニッツは、微積分学の発見をニュートンと争った数学の天才だ。ライプニッツ自身としては、2進法の発見を最も高く評価していたらしい。2進法を応用した万能計算機も提案していたので、現代のデジタルコンピューターを夢見た、最初の人類だ。万能計算機とは、整数演算と論理演算を組み合わせた計算機だ。その論理演算は、後に一階述語論理として完成し、実際にコンピューターのプログラミング言語として実装された。日本経済が世界で輝いていた30~40年前の、「第五世代コンピュータシステムプロジェクト」(5Gプロジェクト)の話で、第2次AIブームと呼ばれている。論理学者クルト・ゲーデル(1906-1978年)の不完全性定理によって、数学(整数論)の真なる命題には、形式的な手続き(一階述語論理を含む)では証明できない命題があることが、証明されていたけれども、不完全性定理のような強力な命題が証明できることは、驚異でもあった。もちろん、5Gプロジェクトは、10年以上の時間と、相応の予算を使って、技術目標を達成した。しかし、日本政府にとっての産業の成長や、経済の活性化には、ほぼ無縁だった。筆者の考えでは、確実な知識を要求したので、知識ベースの作成が予想以上に困難だったのだろう。そもそも、不確実性が加速度的に増加する現代社会において、産業や経済に役立つ知識に、確実な知識などありえないのかもしれない。

チャットGPTなどの、言語能力を競うAIが実現され、不確実ではあるけれども、大量の知識ベースが使える時代になった。関係データベースを構築する仕事では、大量のロジカルチェックプログラムを作成して、データベースの整合性をチェックする。問題があれば、入力されたデータを、再度問い合わせて、確認するとともに、その取り扱いを検討する。本論では、データマネジメント業務の内容までは立ち入らないことにして、関係データベースではデータ相互の関係が重要であり、知識ベースの場合は論理的整合性が重要になることだけを記載しておこう。AIが生成する「不確実」だけれども大量の知識ベースを、論理プログラミングでロジカルチェックする機械学習法を思いついた。知識ベースに論理的不整合を発見すると、その不整合の論理パターンをチェックリストに追加する。チェックリスト自体の論理的整合性も再チェックして、論理的に整合性がある論理的に不整合な論理パターンのチェックリストを機械学習する。このような「発見的」なアルゴリズムを、一階述語論理でうまく記述できるかどうかわからないけれども、非論理的なディープラーニングと、論理プログラミングの組み合わせは興味深い。どちらも「みんなで機械学習」するには重たい技術なので、第4次AIブームに第2次AIブームで味付けをした番外編でしかない。本論は、機械学習との学習という、学習のありかたそのもの再考に向けて進んでゆく。AI将棋との学習を見ていればわかるように、機械学習との学習では、若い人たちが有利であるとともに、先輩たちも含めた集合知も不可欠だ。少子高齢化する日本では、業務で忙しい中年労働者がリスキリングするよりも、小学生と老人たちが、機械学習との学習を楽しめる環境のほうが有望だろう。次稿では、知識ネットワークにおける新しい学習法(もしくは知識表現)、ニッチ&エッジについて考えてみたい。

◆次回以降の予定

3.5 学習は境界領域の積分的探索

3.6 機械学習との学習

--------------------------------------

『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。

コメント

コメントを残す