山口行治(やまぐち・ゆきはる)
株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニング®のビジネス展開を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長、Pfizer Global R&D, Clinical Technologies, Director。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。
◆リスク適応的マネジメント
個人の栄養状態をデータによって評価して、個人の健康リスクに「適応的(adaptive)」に対処することが本稿の出発点だ。健康に配慮した毎日の調理を、体重の増減で一喜一憂するようなものなのだろうか。あえて、農作物の生産の段階から、個人の健康リスクに「適応的」に対処しようとする試みの新規性は、「適応的」というキーワードに込められている。
本シリーズでは、何度も米国の思想家、ナシーム・ニコラス・タレブが提案した反脆弱(ぜいじゃく)性について考えてきた(※参考1:『みんなで機械学習』第31回「ウイルスの知恵〈反脆弱性〉」、など)。不完全な予測に基づいて、頑強なリスク対処システムを構築するのではなく、リスクを伴う状況のランダムな変動にしなやかに対処して、場合によっては早急に避難するという考え方で、筆者は勝手にリスク「適応的」マネジメントと解釈している。リスクマネジメントに関する国際標準規格ISO31000では、リスクに金融資産のリスクも含めているけれども、金融商品への投資におけるリスクとリターンとは区別している。タレブはトレーダーとしての経験から、ISO31000のような大規模な組織的アプローチではなく、個人レベルでも実行可能な、小規模で迅速な行動プログラムを重視している。危機的状況では、思考は停止しているようなものなので、考えなくても行動できる習慣や習性が重要になる。小さいグループが、個別に判断して行動したとしても、小さいグループの集団が、うまくリスクを乗り越えてゆくことが、生物進化の秘密だと思われる。このような行動様式を「適応的」行動と呼ぶことにすれば、「適応的」行動は、あらかじめプログラムされていて、行動の目的(例えば生存)に最適化された感覚器官からのデータを迅速に処理する仕組みで、高度で大規模な仕組みである必要はない。リスクに対処する思考やシステムが、最適化されているわけではない。不完全な予測に基づいて、システムを最適化しても、実際の状況においては、個人やグループの行動が、全体最適である必要はないからだ。感覚器官からの、現場のデータしか頼りになるものはない。
農家が、農作物の消費者の健康を考えることが、なぜ「適応的」になるのだろうか。農家が自然災害リスクや、市場でのリスクを考えて、農業を行うことは、正統派のリスクマネジメントだ。糖尿病患者のための農作物、痛風患者のための農作物などを考えて開発しても、個別化医療には貢献できても、市場が細分化されるだけで、農業のリスクマネジメントにはならないだろう。筆者が考えていることは、農作物を売るのではなく、農家が、売れない、食べられない「データ」を提供することだ。農家自身が、農作物を食べて、個人の栄養状態の変化を機械学習する。第一に、農家自身の健康リスクに配慮して、予防的な食生活のあり方を「データ」から学習する。その学習結果ではなく、「データ」そのものを提供するので、データの利用者も、自分自身のために機械学習する。このような、機械学習の連鎖を、農家が発信・推進して、社会全体を変革してゆくという物語だ。「適応的」と「データ駆動型」をほぼ同じ意味で考えているけれども、「適応的」の場合は、行動もしくは行動変容まで視野に入れている。
◆健康リスク
リスク適応的マネジメントは、生物進化や長期の人類社会の変化という意味では、保守的で常識的な考え方だろう。近代以降の産業社会において、リスクマネジメントが発達する以前の、前近代的な考え方でもある。しかし筆者が、リスク適応的マネジメントが、近代を乗り越えてゆく、「データ」の時代への入り口と考えるのは、単に「データ」を活用する可能性だけではなく、近代合理主義の哲学と鋭く対立する思想的地盤の近未来性にある。近代合理主義は全体最適化を目指す、一神教的な、「属性」中心の哲学で、「所与」でしかない個体差を理解できなかった。「所与」すなわち「データ」は、人間が理解するには労多く実りが少ない世界で、しかも「データ」は、センサーとネットワークの発達で、爆発的に増大している。「データ」は、科学のような理論の防波堤を超えて、生活や社会に溢(あふ)れている。近代以降、社会システムが大型化して、不確実性が増大していることが、リスクマネジメントを必要とする大きな理由なのだけれども、リスクは、日常的な「不安」として、生活における「希望」を破壊している。大量の「データ」が「不安」を増大していると考えることもできるけれども、人びとが「データ」を機械学習することで、「希望」を見いだすことで、マイナス×マイナスをプラスにしようというわけだ。生成AI(人工知能)のような、最先端のAI技術でなければ、機械学習は、5万円以下のパソコンで十分だ。パソコンが一晩考えている時間に、人びとは快眠すればよい。実際に筆者は、何度もパソコンが長考するプログラムを作成してきた。それは、筆者にとっての、新しい希望を夢想する時間でもあった。
個人の健康リスクに、リスクマネジメントシステムで対処することが困難なことは、予防医学があまり成功していないことから明らかだろう。健康リスクは、個体差(個体間変動)が大きいことに加えて、各個人の健康リスクの経時的な変化(個体内変動)が重要で、個体間変動と個体内変動の複雑な絡みによる予測誤差を評価することは困難だ。一方で、「適応的」対処は生活習慣そのものなので、成功か不成功かは別問題として、体重の増減に一喜一憂するようなもので、誰でもが行っている。認知症になるリスクの予測よりも、体重が増加するするリスクの予測のほうが、はるかに容易だ。「適応的」対処の範囲や対象を工夫すれば、健康リスクの適応的マネジメントは、予防医学の有用なツールとなるだろう。筆者が探求している個体差の機械学習(フェノラーニング®)では、表現型の個体差に注目するので、年齢と性を「データ」から予測することを、第一優先としている。そして、その予測誤差を評価する。体重も、収入や社会的ステータスの表現型と考えることもできるので、体重の変動を「データ」から予測することも重要であることは確かだ。生物にとっての場所の表現は、地理的な場所だけではなく、社会的な順位など、個体間の距離としての個体差であるため、とても重要なのだけれども、「データ」から予測することはとても難しい。次稿に継続する宿題としたい。
◆経済的リスク
社会や職場の経済的リスクの場合はどうだろうか。機械学習技術を農業に応用する宿題のリスト(※参考2『みんなで機械学習』第42回「データを食べる」)では、(4)(5)(6)(7)あたりが関係していて、主要な宿題となっている。この宿題を作成していた段階では、社会や職場の経済的リスクを、生活における経済的「不安」と、漠然とした問題設定としていた。リスクを「不安」ととらえると、リスクに加えてセキュリティーの問題が混入する。犯罪や事故などの、小さいセキュリティーは保険の対象となる。軍事やサイバー攻撃などの重大なセキュリティーは保険がないので、リスクとして考えてもよいかもしれない。保険を掛けたから安心というわけでもないので、「不安」という意味では、リスクとセキュリティーの区別はあいまいになる。
国際標準規格ISO31000のリスクの定義は、目的に対する不確かさの影響であって、必ずしも望ましくないことだけではない。しかし日常言語でのリスクは、災害や事故など、低い確率でしか起こらないけれども、大きな影響がある場合を意味することが多い(※参考3、※参考4)。犯罪のリスクは、セキュリティーの問題だけれども、大きな「不安」要因でもある。リスクをどのように定義しても、確率現象であって、しかも予測困難な事象であることは確かだ。予測困難な問題は、予測が当たりにくい場合と、予測誤差の評価が困難な場合があって、数学的には別の問題になる。確率の問題なので、確率分布について考えているので、数式が無いとわかりにくいかもしれない。正規分布であれば、平均値と分散が正確に推定できれば、従来の統計的な方法で何とかなる。分布のすそ野が長い(極端な値が出やすい)場合には、分散が無限大になってしまったり、予測誤差が大きいのか小さいのかもわからなくなったり、とにかく、リスクにおける確率現象は、予測困難としか言いようがない。専門家でも予測困難なので、タレブの反脆弱性が画期的なアイデアというわけだ。トレーダーは、経済的リスクの適応的マネジメントを職業としていて、特別な嗅覚(きゅうかく)があるのかもしれない。
健康リスクの場合、西洋医学の視覚や聴覚による診断技術とは別世界で、東洋医学では、触覚(特に痛覚)・臭覚・味覚などの近接的な感覚を重要視している。経済的リスクにおいても、1か月単位の従来の経済指標とは別に、日時単位の、より高速な経済データが活用されるようになった。株売買などの、金融商品取引においては、ミリ秒単位となり、コンピュータープログラムが取引を行っている。より近接的な感覚が求められていることになる。しかしこれらのデータは、市場内部のデータであって、市場外部の経済的リスクには、どの程度の感度があるのか、全く不確定だ。内部データには特異点(大きな影響力がある隠されたデータ)が含まれる場合が多いので、筆者としては、外部との接点にある、周辺のデータを積分することを提案している。口コミデータに周辺との距離感を加えたデータのようなものだ。組織の周辺を見いだすことが重要で、組織活動の脆弱性を評価する出発点となる。周辺のデータであるため、近接的な感覚を重要視しすることになる。
農業は、食糧の生産という意味では、すべての人びとに直接的に関係しているけれども、高級レストランに直販しているなどの例外を除いて、購買者からのフィードバックは市場価格でしかない。産業的には、多くの製造業の周辺だし、都市生活圏の周辺でもある。農家の多くは個人事業主として青色申告している。個人事業主としての農家に、詳細な経済データを収集してもらうというのが筆者の提案だ。健康リスクの場合のプレシジョン栄養学(データ駆動型栄養学)のデータに対応する、経済的リスクにおける経済の栄養状態のデータについて考えている。FRB(米国の中央銀行に相当する連邦準備制度理事会)の目的が、物価安定と最大雇用の達成であることから、経済の栄養状態にとって、物価と雇用が重要であることは確かだろう。物価のミクロデータは、スーパーマーケットやコンビニの売上データ、および企業の購買データなどから詳細に分析されている。しかし、物価の周辺データとして、農家が、毎日の生活および農業の購入において、実際に買ったものだけではなく、買わなかったものに関するデータを収集できれば、周辺的ではあるけれども、網羅的な物価データとなるだろう。このようなデータがあれば、生活における地域特性や、農業の事業特性も容易に解析できる。雇用については、兼業農家が興味ある課題だ。専業農家であっても、冬場の農閑期には、出稼ぎのような、短期の雇用に依存する場合が多い。それらの補助的な事業外収入と同程度の収入範囲で、農家専用の新新NISAを設計して、農家による投資行動をリアルタイムにウォッチしてはどうだろうか。雇用のデータを直接収集することは、入力の負担が大きく、個人情報の問題などがあるため、雇用データではなく、投資データとして工夫してみた。ここでも、投資を検討したけれども投資しなかった理由などをデータ化する。農家としては、データを「売る」ことはできないかもしれないけれども、自分自身の経済的栄養データを機械学習することで、個人事業としての事業収支予測が正確になるはずだ。事業収支予測に使ったデータの量と、予測の正確性を評価して、納税額から減税することでインセンティブとすることができるだろう。税金は、取り立てるだけではなく、生涯教育としても、最大限に活用したい。
リスク適応的マネジメント、特に経済的リスクについては、まだまだ具体的な入り口を模索している段階なので、次稿に継続する宿題としたい。
◆When The Music’s Over
「花はどこへ行った」(Where have all the flowers gone)は、世界で最も有名な反戦歌だそうだ(※参考5:https://ja.wikipedia.org/wiki/花はどこへ行った)。筆者も、特にキングストン・トリオの歌が好きだ。筆者の時代では、The DoorsのWhen The Music’s Overが忘れられない。最近、あらためてウッドストック・フェスティバル(※参考6:https://ja.wikipedia.org/wiki/ウッドストック・フェスティバル)の映画を観て、当時の米国の若者が<Music>を求めていたことがよくわかった。The DoorsのThe Musicは、定冠詞Theによってその曲そのものを意味しているけれども、ウッドストックでみんなが求めていた<Music>のことだと思うと、背筋が寒くなる。実際に米国では、<花>だけではなく、<Music>も終わってしまった。筆者としては、言語(language)が終わってしまうとまでは思わないけれども、語りえぬものに哲学が沈黙している現在では、言語に近未来への期待はできそうもない。筆者としては、「ニュース屋台村」において、「データ」に活路を見いだそうとしている。「語りえぬもの」は、有名なウィトゲンシュタインの『論理哲学論考』(岩波文庫 青689-1、※参考7)の結語だけれども、問題は簡単で、哲学は固有名詞を語ることができないというだけのことだ。定冠詞がつく固有名詞は、場合によって番号だけで識別され、言語というよりもデータとしての性格が強い。もちろん、現在のAI技術、例えばLLM(大規模言語モデル)も固有名詞を上手に識別できない。上手に、というよりは、責任をもって、というほうが正確で、固有名詞の識別は、特定の社会を構成する基本的な語録となる。しかし、現在のAIの言語は、どの社会にも属していない(実際はグローバルIT企業と覇権国家に管理されている)ので、特定の社会の中での固有名詞間の整合性を取りようがないのだ。都合良く解釈することしかできないので、大きく脱線することがある。
みんなで機械学習すれば、特に農家が自営業の業務として機械学習することで、上記の固有名詞の問題を乗り越えることができるだろう。自分たちの周辺での固有名詞を正確に識別して、近隣の仲間との整合性をとりながら、地域や社会全体に固有名詞の定義域を広げてゆく。固有名詞、例えば人名には、時代と地域の特性がある。特に「The」などの定冠詞がない漢字文化の場合は、漢字に構造的な「意味」があるので、漢字の組み合わせによって固有名詞が識別可能だ。漢字の構造的な意味を機械学習する課題も、次稿の宿題としたい。
※参考1:『みんなで機械学習』第31回「ウイルスの知恵(反脆弱性)」(2023年11月27日付)
https://www.newsyataimura.com/yamaguchi-105/
※参考2:『みんなで機械学習』第42回「データを食べる」(2024年7月8日付)
https://www.newsyataimura.com/yamaguchi-120/
※参考3:『リスクを考える-「専門家まかせ」からの脱却』(吉川肇子、ちくま新書1661、2022年)
※参考4:『リスクの正体-不安の時代を生き抜くために』(神里達博、岩波新書1836、2020年)
※参考5:https://ja.wikipedia.org/wiki/花はどこへ行った
※参考6:https://ja.wikipedia.org/wiki/ウッドストック・フェスティバル
※参考7:『論理哲学論考』(ルートヴィヒ・ウィトゲンシュタイン、岩波文庫 青689-1、2003年)
https://www.iwanami.co.jp/book/b246897.html)
--------------------------------------
『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、みんなと学習します。技術的な内容は、「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、フェノラーニング®を実装する試みを開始しました(yukiharu.yamaguchi$$$phenolearning.com)。
[…] https://www.newsyataimura.com/yamaguchi-124/ […]
[…] 第46回「リスク適応的マネジメント」(2024年9月3日付) https://www.newsyataimura.com/yamaguchi-124/ […]