п»ї Small Random Patterns are Beautiful 『みんなで機械学習』第10回 | ニュース屋台村

Small Random Patterns are Beautiful
『みんなで機械学習』第10回

10月 10日 2022年 社会

LINEで送る
Pocket

山口行治(やまぐち・ゆきはる)

o株式会社ふぇの代表取締役。独自に考案した機械学習法、フェノラーニングを実装して、ビジネス応用を模索している。元ファイザージャパン・臨床開発部門バイオメトリクス部長(臨床試験データベースシステム管理、データマネジメント、統計解析)。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。

『みんなで機械学習』は、第9回を最後に1年ほど中断してしまった。その1年の間に、世界が政治経済的に分断され、ビジネス環境が大きく変化している。第9回の「ビジネス関連特許の9画面表現モデル」は、筆者が40年以上考え続けているデータ論としては、ひとつの到達地点だったと思う。西欧哲学的な、真・偽、敵・味方、など2項対立の論理はとても強力で、データの統計解析においても、2×2分割表などの形で様々に利用されている。こういった単純な古典論理が有用であることは疑いない。しかし、自然や社会のデータが、古典論理に従っている、古典論理で理解できるというのは単純すぎるし、量子力学などの複素数でしか記述できない現象には、古典論理では無力としか言いようがない。「9画面表現モデル」は、3×3分割表のように見えるけれども、中心となる特異点の周りをまわる「廻(まわ)る論理」を表現している。すなわち、データ論を「表現論」として再構築しようという試みだ。

データ論における筆者の興味は、個体差の理解に尽きる。そして、個体差とは「個体差の表現の個体差」であるというテーゼ(作業仮説)が出発点となった。遺伝子の個体差が存在することは事実としても、その物質的な個体差を、「表現」によって増幅している。例えば、ヒトにとってスズメの個体識別は困難であっても、スズメはスズメの個体識別は当然として、ヒトの個体識別も上手に行っている。スズメやヒトが、その関係において「何を表現しているのか」に注目すれば、個体識別の仕組みを理解できるようになる。スズメやヒトのような動物の場合、「何を表現しているのか」ということは、性別・年齢・場所に大きく依存している。動物にとっての場所の表現は、データ論の立場からは、順位・順番が最重要であることも理解できるようになってきた。「表現論」においては、作者・作品・作品の鑑賞者および鑑賞の場、という3要素が不可欠で、2項対立の古典論理の限界を乗り越えてゆく。未来志向のデータ論としては、『みんなで機械学習』第9回が、ひとつの頂点だった。

『みんなで機械学習』第1回では、CAPDサイクル(ビジネスのPDCAサイクルを、機械学習との組み合わせでCheckから始める加速モデル)を紹介して、4回転半のゴールを設定した。CAPDサイクルを2回転したところで、上記のように、ひとつの頂点に到達した。AI(人工知能)プログラムを使って「みんなで機械学習」するのはCAPDサイクルの前半で、後半は中小企業経営者が自習する。自習して「ふりだし」に戻る。ビジネスに限らず、ヒトが作り出して、ヒトが解決できない多くの社会問題・地球環境問題にチャレンジすることもAI技術に期待されているので、ヒトも機械も忙しい。地球環境すら破壊してしまう認知症を生きる人類には、「みんなで機械学習」が必要不可欠なのだ、と『みんなで機械学習』第9回を結んだ。

<カマキリ2題>=2022年9月28日 筆者撮影

『みんなで機械学習』第9回が、ひとつの到達地点だったとしても、政治経済やビジネス環境が大きく変化してみると、それは楽観的な頂(いただ)きであって、足元には断崖があり、遠方にはどこが山頂ともいえないような、連山が見える。「廻る論理」は、大回りをする場合と、小回りの場合では、ゴールまでの回転数が異なる。危険な断崖を避けて大回りする場合もあれば、身動きもせず、空想だけが空回りする場合もあるだろう。『みんなで機械学習』としては、表現論をベースとする新規なデータ論を構築して、様々な応用を模索すれば十分かもしれないけれども、楽観的な未来予測が困難な現状においては、筆者自身のゴールを明確にして、足場を確保する必要がありそうだ。個体差が大きい試験データを適切に解析して、個体ごとに薬効を推定することが可能になると仮定しよう。筆者自身のゴールとしては、加齢とともに発症リスクが高まる疾患の、長期投薬による薬効を最適化する環境因子の探索を、『みんなで機械学習』してみたい。例えば、認知症の治療薬および予防的な薬物療法において、個体ごとのデータを機械学習して、食事や生活習慣を最適化することを考えている。逆に考えて、個体ごとに薬効を最適化できれば、プラセボ(偽薬)コントロールの必要がなくなり、個体ごとに薬効を推定することも可能になるはずだ。

仮にゴールを設定してみると、当初考えていたような、CAPDサイクル4回転半でたどり着くことができるほど容易(たやす)いゴールではないことが明らかになる。戦争で殺戮(さつりく)を繰り返し、地球環境を破壊する「認知症を生きる人類」にとって、認知症の治療戦略は、医学だけではなく、社会全体の問題でもある。特に、2050年には認知症大国となることが確実な中国にとって、認知症治療を米国・日本の製薬企業(アリセプト®)に依存するようでは、軍事外交的に最大の弱点となるだろう。

<カマキリ2題>は、軍事外交とは何の関係もない。『みんなで機械学習』を、筆者自身のデータ論として再出発するときに、紆余(うよ)曲折が予想されるので、雑談を交えながら、ニュース屋台村における別シリーズ『週末農夫の剰余所与論』34回を引き継いで、気分転換をしたかった。「ニュース屋台村」では『データを耕す』シリーズ10回(と番外編)、『住まいのデータを回す』シリーズ22回、『WHAT^』シリーズ44回もデータ論の準備、または番外編だった。

データ論は多くの場合、データ解析の話に終始する。筆者としては、データ解析の対象となるデータの準備過程、データマネジメントに重点を置いてきたつもりだ。企業において、データマネジメント部門は、データ解析部門の3倍ほどの人員が必要になる。ディープラーニングなどの、実務として成功している機械学習技術は、データマネジメントを自動化していると考えることができる。大量のデータを収集してデータベースを構築する場合、従来はヒトが理解しやすい、論理的に整合した関係データベースを設計・構築していた。ディープラーニングでは、コンピューターが画像解析しやすいようなデータ構造(テンソルという行列を一般化した数学的構造)に、大量のデータを超多層にマッピングして解析する。データとプログラムが分離していないので、従来のデータ解析とは根本的に異なるコンピューターの利用技術なのだ。ディープラーニングを使ったAIシステムの場合、プログラムの動作原理を論理的に説明できないため、様々な倫理的な問題に対処する必要が生じる。例えば、テロリストを検出するプログラムにおいて、データとなる過去のテロリストの画像が特定の人種に偏っていた場合、ディープラーニングのプログラムの解析結果も偏ることが推測されるけれども、どの程度どのように偏るのかということは、データからは推定できない。筆者が発案したフェノラーニングは、表現論を動作原理とすることで、ディープラーニングよりもヒトが理解しやすいデータベースを自動的に構築する。機械学習技術をデータマネジメントの観点から再考するようになったのは、最近の成果で、過度にAI技術に楽観的になってはいけないという、1年間の反省期間が役立っている。

最後に、現時点で想定している次回以降の物語展開を<目次>としてまとめてみた。データ論全体のタイトルとした「Small Random Patterns are Beautiful」の解題(かいだい)にもなっているはずだ。技術哲学としての物語の流れと全体像を明確にするために、<目次>は英語で作成してみた。英語のプレゼンの感覚で作ってみた。序文と終章などは、日本語固有な表現が多い。もちろん、「ニュース屋台村」では日本語の記事になるように、時事雑談も交えて、日本語で連載する予定だ。

1Opening, Life and society – thousands of issues and billions of solutions
1.1Individual variabilities – Small but not negligible uncertainty
(時代は感受性に運命をもたらす)
1.2 Collective intelligence of people and organizations
(円周率)
1.3 Can human learn from machine?
(ブラウン管ヲ見ヨ)

2 Technologies and Nature
2.1Arts to Technologies
2.2Technologies to “Science & Technology”
2.3Data Science Technologies and Arts
– Data is the nature of computers
2.4 Sparce random matrix as a model of the data world
– 316×3165 random data matrix generate dense 316×316 particle matrix and sparce 3165×3165 field matrix
2.5Spectrum of the random data matrix
2.6Data cycle

3 Machine learning technologies and PhenoLearning
3.1 Automated dataset construction
3.2 Random forest and gradient boosting
3.3 Deep Learning automatically construct imaging dataset
3.4 Alfa-GO zero automatically construct reinforcement learning dataset
3.5 GPT-3 automatically construct sentence dataset
3.6 PhenoLearning® require the conceptual framework of the individual variability (symbiotic diversity)

4 Symbiotic diversity
4.1 Uncertain life and economy
4.2What life, economy and technology express?
4.3 Small data approach – symbiotic diversity of the individuals
4.4 History – evolution of symbiotic diversity
4.5 Combinational optimization of life factors to evaluate uncertainty of life
4.6 Weak optimization – rich/poor, stability/growth, fragile/antifragile, and more
4.7 A big prediction or many small adaptations

5 Self-motivated Small Organizations
5.1 Society, community, family vs. Nation and company
5.2 Organizations are made by organizations – Organization Cycle
5.3 Machine learning organization
5.4 CAPD cycle
5.5 3×3 table of business expressions
5.6 Margin of organization – integral approach
5.7 intellectual free energy industry知的自由エネルギー産業

6 Closing – Beautiful random patterns in life and society
(中里斉 Hitoshi Nakazato, Monado)
6.1 Nearly “all is vanity” world (ほとんど色即是空な世界)
6.2 Non observable blackhole exist?
6.3Big typhoon technologies will fade-out rapidly
6.4 Extended and prolonged PhenoLearning®
– Artist die twice, but art work will alive

--------------------------------------
『みんなで機械学習』は中小企業のビジネスに役立つデータ解析を、オープンソースの無料ソフトOrangeでみんなと学習します。質問があっても、絶対に「ニュース屋台村」にはコメントしないでください。「株式会社ふぇの」で、Orangeにフェノラーニングを実装する試みを開始しました。

コメント

コメントを残す