山口行治(やまぐち・ゆきはる)
在野のデータサイエンティスト。元ファイザーグローバルR&Dシニアディレクター。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。職業としては認知されていない40年前から、データサイエンスに従事する。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。
バーチャルリアリティ(VR)がもてはやされた時代があった。コンピュータの3Dモデルをリアルタイムで画像化する技術だ。レーシングカーなど、コンピュータゲームではおなじみの技術だが、圧倒的なパワーの3D画像技術により、ゲーム感覚というよりも、「仮想現実」といったほうがピッタリで、様々な産業応用が期待されている。パイロット訓練用のフライトシミュレータ、医療画像を使った外科手術のシミュレータなど、すでに実用段階になっている。
最近では人工知能(AI)がもてはやされている。VRは3Dプリンターが実用化されて、バーチャルではない現物が作れるようになった。AIもロボットという現物が、工場の中だけではなく、お店の接客に使われるようになっている。本稿第4回「表現型としての個体差、哲学からデータサイエンスまで」において、シミュレーション技術を応用した模擬的患者集団の試みを紹介した。映画「アバター」が話題になる前に、ハーバード・メディカル・スクールを中心に開発されたi2b2(※参考1)というソフトウェアにおいて、模擬的患者集団を作成する試みが行われ、アバターと名付けた話を聞いた。患者のアバターは映画のアバターのように大きい格好の良いものではなく、発想は逆で、実際の患者のデータと見分けがつかないようにシミュレートされたデータのことで、医療情報のセキュリティに配慮したものだ。
AI技術の応用として、米国ではベンチャー企業 (※参考2)が、英国では政府関係機関(※参考3)が、「仮想医師」の実用化にチャレンジしている。「仮想医師」という意味では、Virtual Doctors(※参考4)がアフリカの医療を英国からの遠隔医療で支援するチャリティーサービスを展開している。AI技術を遠隔医療に応用することで、大きな経済効果が期待されている。「仮想患者」と「仮想医師」、それぞれ目的は異なるけれども、すでに実用化されているサービスで、経済効果だけではなく、近未来の医療を大きく変えてゆくだろう。もちろん日本でも、政府、企業、学会がAI技術の医療応用を大合唱していて、毎日のように新聞の紙面をにぎわせている。しかし、「仮想医師」が「仮想患者」を診察する時代は、どんな時代になるのだろうか。AI技術の医療応用にはアクセルとブレーキの両方が必要で、その経済的なメリットだけではなく、「生きる」希望が育まれるような、公共的な観点からの議論を積み重ねてゆく必要がある。
◆ビッグデータの時代
経済学において、信頼できる統計データは人口と税金のデータぐらいのものだったのかもしれない。米国のトランプ政権では、気候変動のデータですら、政府見解でどうにでもなってしまう時代だ。信頼できないデータは大量に存在する。ビッグデータの時代には、信頼できないかもしれないけれども、大量のデータが、ほぼ無料で入手できるようになった。インターネットに公開されている情報をデータ化して、国家や巨大企業が保有するデータのデータベースと連携して解析する。単に量が多いだけではない。文字だけではなく、音声や画像といった異質で多様なデータが、ほぼリアルタイムに集積されている。
ビッグデータの時代には大量のCPU(コンピュータの中央演算装置)が使われている。台数という意味ではスマートフォンのCPUが圧倒的で、正確な出典はよくわからなかったけれども、全世界の人口の50%ぐらいではないかという記事があった。一つのCPUに四つ程度のコア(演算装置)が実装されていることを考えると、データ処理装置としては人の頭脳よりもコンピュータの台数が多いことは確実だ。筆者は10コア以上使っている。部下や奴隷はいない。
本稿第1回で自動運転車に懐疑的な発言をした。今でも運転手付きの車に乗っている方々がいるのだから、特に自動運転車を非難する必要はないだろう。働いているのがヒトなのかコンピュータなのかといった違いに過ぎない。それでも自動運転車に違和感があるのは、経済性だけがクローズアップアされて、交通事故のデータがどのように公開されるのかなど、公共的な観点が欠如しているからだと思う。
ヒトであれば税金がかかる。AIロボットにはどのような税金を適用するのだろうか。機械学習に提供されるビッグデータも、学校教育のようなもので、公共的な観点からあらかじめチェックしておかないと、大人になったときに、大きな問題を引き起こす可能性がある。
◆医療データと健康データ
患者のデータは患者自身のものであることは言うまでもない。しかし日本人の遺伝子データは日本国のものという見方もあり、遺伝子データは国や地域によって管理されている。医療画像データなどは検査をした病院が管理している場合がほとんどだろう。個人の権利としてのデータの帰属よりも、データ管理の経済的な課題が優先されている。データから利益を得ているのは、国家と大企業だけだ。
医師の資格は国家試験なのだから、国家や病院が医療データを管理することは理解できる。逆に言うと、医療データにAI技術を応用しても、医師の人件費がコンピュータに代わるだけで、経済的な効果ぐらいしか期待できないだろう。そうはいっても、アフリカで先進国の医療サービスが可能になれば大きな変化ではある。医療技術の進歩により、治療可能な病気は増えたけれども、相変わらず治療できない病気はたくさんあり、寿命が延長したことで、介護の負担が大きくなっている。経済的な理由だけではなく、患者の立場からも、期待されるのは予防医療の進展だ。公衆衛生というと感染症予防が中心になるけれども、心臓病や認知症など、予防医療に期待される分野は多い。
患者さんの医療データではなく、発症リスクを推定する健康ビックデータをどのように収集・管理・活用してゆくのだろうか。本稿第2回と第6回に紹介したパーソナルゲノムのデータも、健康ビックデータの仲間になる。番外編第3回に紹介した体重計もその仲間だ。健康ビックデータは、国家や医療機関が管理するのは問題だろう。グーグルのような巨大企業ではどうだろうか。「トランプに投票するかどうかは、死が教えてくれる」、米国大統領予備選挙の投票結果を分析すると、40~64歳の白人による死亡率が高い地域と、トランプ氏の得票率が高い地域が一致したという(※参考4)。死亡率だけであれば、国家の人口統計データで十分だけれども、巨大企業が健康ビッグデータを独占した場合、政治的な影響力は計り知れないものとなる。
健康ビッグデータは各個人が管理して、仮想データとして匿名化してから公開する仕組みを考えたい。遺伝子データの場合、数人分を無作為に混ぜて仮想データとしても、工夫すれば復元できてしまうらしい。ジェークスピア、ドストエフスキー、川端康成の小説を無作為に混ぜても、出典が分かってしまうようなものだろう。本稿第4回で考えたように、個体差を表現型として再考すること、すなわち「仮想患者集団」として仮想データとすれば、予測可能性という意味で個人のデータが匿名化される。この場合でも、公開しないオリジナルの患者集団データは誰かが管理しなければならない。完全な管理システムは期待できないので、ほぼ安全なプロセスでたくさんの仮想データを作って、コンピュータシステムで管理してはどうだろうか。
◆AIにとっての真偽と勝敗
医療データに機械学習などのAI技術を応用する場合、コンピュータは誤診を含んだ診療履歴から学ぶことになる。そもそも臨床診断と病理診断が一致することのほうがまれで、何を誤診とするのかという、医療における真偽の問題から考え直す必要があるだろう。患者の立場からいうと、病気が治るかどうかが問題になるので、臨床診断に近い立場になるけれども、データベースを作成する目的でコーディングする場合は、病気の分類システムをよく理解する必要があるので病理診断に近い立場となる(本稿第6回参照)。
製薬企業で新薬の臨床試験を行うと、新薬の薬効が統計学的な意味で検証される場合を「勝」、検証できない場合を「敗」という。もちろん、新薬がプラセボ(偽薬)に有意差をもって負けるようなことはないけれども、そのようなデータでは承認申請できないので、経済的な意味で「敗」けたことになる。
医療データをAI技術で分析すれば、データサイエンティストが手作業でプログラミングするよりも、効率よく網羅的に真偽の判定や、勝敗の最適化を行うだろう。しかしそれぞれ、善悪や損得といったAI技術を開発した企業の価値観が潜在的に反映していることに注意する必要がある。
健康ビックデータに医療データのようなAI技術を直接応用することはとても危険であることも理解してもらえるだろう。健康ビックデータは、まずデータを耕すことから始めよう。善悪や損得に流されてはいけない。健康ビックデータは仮想的な個人がコンピュータの中で生きてゆく物語の始まりとなる。病気ではなく、治療法もない、身体的な障害や精神的な障害とともに生きてゆく「仮想個人」も大量に生成されるだろう。
◆無作為に不確実な世界を仮想的に生きる
もしも確実に問題を解決する方法が分からないのなら、まずは無作為に試してみたほうが良い。自然はそのように出来ているように思われる。人工物である社会問題の場合は、政治家や宗教家がいろいろな解決策を提案するけれども、グローバル化した現代の社会問題はヒトの手に負えるものとは思えない。無作為に試すのであれば、AIが決定者であっても問題はないだろう。重要なのは、予測が外れていることをいかに早く正確に察知するのかということだ。
気味悪い話になってしまい申し訳ない。コンピュータが経済的な損得を超えて、ヒトの生活に影響を与えるようになる近未来の物語はすでに始まっている。ゲーデルの不完全性定理(※参考5)は形式的な論理体系が、自分自身の無矛盾性を証明できないことを明らかにした。そんなことは数学者だけの問題だとは言っていられない時代となっている。計算機科学の基礎に大きな影響を与えているし、計算機システムにとって、どの程度の問題なのか、量的な評価はできていない。整数よりも有理数(整数の分数)のほうが多いことは容易に理解できる。有理数よりも無理数のほうが多いことは直感的に明らかでも、既知の実数(πやeなど)がとても少ないという事実に不安にならないだろうか。
コンピュータを万能計算機としてではなく、限りなく正確なサイコロを振る実験装置と考えることで、前述の不安は多少和らぐかもしれない。AI技術を実装した量子コンピュータであれば、プログラムが停止しないかもしれないという論理的な不安は和らいでも、決して理解できない実験装置となる(本稿第3回参照)。実際のデータとシミュレートされたデータが区別できなくなり、データはコンピュータにとっての自然となる。
『哲学者はアンドロイドの夢を見たか―人工知能の哲学』(※参考6)という刺激的な哲学書を読んだことがあるだろうか。筆者は「アンドロイドが哲学者となる夢」が実現されるのではないかと危惧(きぐ)している。アンドロイドは安価な医師になり、安価な弁護士になり、安価な裁判官になり、安価な警察官にもなる。しかし、アンドロイドが詩人になるのは遠い未来の話と思われる。安価な詩人というイメージは浮かばないから。
◆機械学習ではないAI技術、希望を見いだす新技術
希望のない(ホープレス)な社会。かつての米国にはアメリカン・ドリームという神話があった。トランプ政権を支えるのはホープレスな白人中年男性らしい(※参考4)。AI技術が社会に蔓延(まんえん)すると、職を失いホープレスな人々が増え、トランプ政権は強化されるのだろうか。現在、アメリカン・ドリームを楽しんでいるのは、トランプ大統領自身と、ごくわずかなAIベンチャー企業の出資者だけだろう。
筆者は資本主義社会の「経済成長」という神話は、「技術の進歩」という幻影に支えられていると思う。単に地球規模で人口が増加しているだけだし、技術は「進歩」ではなく「進化」していると考えてみよう。数学や科学の一部は確かに進歩している。しかし技術がその進歩を取り入れるのは大進化の時代だけで、あとは新天地で生き延びるために、既存の技術をつぎはぎにしているだけだ。
ヒトは機械学習と争ってはならない。機械学習は最先端の軍事技術でもある。機械学習は経済的な問題解決法を見いだすかもしれないけれども、ヒトの希望を見いだすことはできない。トランプ政権が、自分たちに投票した支持者に希望を与え、死亡率を低下させることを期待したい。期待は裏切られるかもしれないし、他国での死亡率の増加という代償を払うことになるのかもしれない。政治のプロセスに身をゆだねるのはリスクが大きそうだ。
学習のプロセスの場合はどうだろうか。希望を見いだすための学習では、希望をつぶしている要因を分析するか、新天地を発見することになる。前者は、問題の解決に政治の力を借りることになるだろう。希望をつぶしている要因に、政治不信、政治の機能不全があるのだから、前者は困難な道となる。
技術は学習できる。希望を見いだす新天地は、新しい技術として進化してゆく。大量のヒトを使う、例えば軍事技術はコンピュータの得意分野となる。逆に、少人数のチームワークで支える技術は新天地となるだろう。そういった分野にAI技術を応用してみたい。そのときのAI技術は機械学習ではなく、仮想現実でもないだろう。ヒト自身が新天地で新しいインテリジェンスを見いだして、新しいAI技術を作ってゆく。技術の進化は止まらない。
参考1:Takai-Igarashi, et.al, On experiences of i2b2 (Informatics for integrating biology and the bedside) database with Japanese clinical patients’ data; Bioinformation. 2011; 6(2): 86–90.
https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3082863/
参考2:Remedy
https://www.remedymedical.com/
参考3:NHS strikes £1m deal with another AI company
http://www.hitcentral.eu/british-journal-healthcare-computing/nhs-strikes-%C2%A31m-deal-another-ai-company
参考4:トランプ現象の背後に白人の絶望──死亡率上昇の深い闇
http://www.newsweekjapan.jp/stories/world/2016/06/post-5278.php
参考5:ゲーデルの不完全性定理
https://ja.wikipedia.org/wiki/%E3%82%B2%E3%83%BC%E3%83%87%E3%83%AB%E3%81%AE%E4%B8%8D%E5%AE%8C%E5%85%A8%E6%80%A7%E5%AE%9A%E7%90%86
参考6:『哲学者はアンドロイドの夢を見たか―人工知能の哲学』(黒崎政男著、哲学書房 、1987年)
※「データを耕す」過去の関連記事は以下の通り
第6回 コーディングの魔術と「辞書の国」
https://www.newsyataimura.com/?p=6541#more-6541
第5回 本当は怖い「データの森」
https://www.newsyataimura.com/?p=6541#more-6541
第4回 表現型としての個体差、哲学からデータサイエンスまで
https://www.newsyataimura.com/?p=6478#more-6478
第3回 量子コンピュータはサイコロを振る
https://www.newsyataimura.com/?p=6410#more-6410
第2回 FDAがAI画像診断システムを承認、遺伝子検査もAIにしたら
https://www.newsyataimura.com/?p=6355#more-6355
第1回 自動運転車は何馬脳なのか
https://www.newsyataimura.com/?p=6319#more-6319
番外編第3回 フランスの体重計を買った
https://www.newsyataimura.com/?p=6585#more-6585
番外編第2回 日本科学未来館に行ってみた
https://www.newsyataimura.com/?p=6480#more-6480
番外編第1回 恵比寿映像祭の「ポピー:アフガン・ヘロインをたどって」 https://www.newsyataimura.com/?p=6379#more-6379
コメントを残す