山口行治(やまぐち・ゆきはる)
株式会社Aデコード研究所設立準備中。元ファイザージャパン・臨床開発部門バイオメトリクス部長(臨床試験データベースシステム管理、データマネジメント、統計解析)。ダイセル化学工業株式会社、呉羽化学工業株式会社の研究開発部門で勤務。ロンドン大学St.George’s Hospital Medical SchoolでPh.D取得(薬理学)。東京大学教養学部基礎科学科卒業。中学時代から西洋哲学と現代美術にはまり、テニス部の活動を楽しんだ。冒険的なエッジを好むけれども、居心地の良いニッチの発見もそれなりに得意とする。趣味は農作業。日本科学技術ジャーナリスト会議会員。
『みんなで機械学習』の2回転目は、CAPDサイクルのチェック(C)フェーズから始まる。今回は無料のデータを大量に取得してみよう。インターネットの特許検索サイト(PATENTSCOPE)において、機械学習を使ったビジネス関連特許を検索すると、6042件ヒットした。具体的には(“machine learning”AND G06Q)で検索している。G06Qはビジネス関連特許に相当する 国際特許分類コード(IPC code)だ。この6042件の特許データ(例えば、出願年、出願国、出願者、タイトル、アブストラクトなど)をダウンロードして機械学習してみよう。機械学習しなくても、出願国は1位中国、2位米国で、出願者は1位マイクロソフト、2位IBMなどという単純な統計はPATENTSCOPEの機能ですぐにわかる。しかし、中小企業経営者にとって役立ちそうなビジネス課題を6042件から探すのは容易ではない。 記事全文>>