06.17
「手のひらで使える」実践型生成AIの開発――統合型ヘルスケアシステムの構築における生成AIの活用シンポジウムレポート(3) | m3.com AI Lab
情報源: 「手のひらで使える」実践型生成AIの開発――統合型ヘルスケアシステムの構築における生成AIの活用シンポジウムレポート(3) | m3.com AI Lab
内閣府 戦略的イノベーション創造プログラム(SIP)第3期「統合型ヘルスケアシステムの構築における生成AIの活用」公開シンポジウムが2025年4月30日に東京都内で開催された。(4回シリーズの第3回。第1回はこちら)
医療データ・医療LLM/LMMの利活用を促進する医療データ基盤
大学共同利用機関法人情報・システム研究機構 データレイク研究開発センター 教授 合田憲人氏
このあとさらに、各研究開発の概要紹介が行われた。まず、大学共同利用機関法人情報・システム研究機構 データレイク研究開発センター 教授 合田憲人氏が「医療データ・医療LLM/LMMの利活用を促進する医療データ基盤」と題して講演した。
モデルを作るためには大規模データセットが必要であり、個別に収集するのは現実的ではない。データを安全かつ適正に利用するための仕組みも必要だ。また、モデルも多種多様なものが多数作られる。そのバージョン管理も必要だ。ハルシネーション対策やシステム連携の枠組みも必要である。それらの技術開発支援を行うためのシステム構築を行っている。
合田教授らは医療系グループと情報系グループでこれらの課題に取り組んでいる。構築されたモデルは研究者によって異なる利用のされ方をするが、モデルの来歴を追跡できるため効率よく開発を進められるという。システムはNIIが運営する学術用情報ネットワーク SINET L2VPN経由で提供される。安全性と高速性を特徴としている。
技術課題解決支援としてはハルシネーション対策や来歴管理を行っている。たとえばあるデータセットがあるとき、それはどこに使われたか、その逆を検証することができる。これによってLLM自体の開発を支援・促進する。
医療用仮想プライベートクラウドという仕組みも提供している。計算機の仮想化技術を用いて、完全に隔離された環境を作って計算機を活用することができる。データの収集・整備については、約2兆トークン、画像・テキストトークンは18億ペア、医療テキスト17.6億文字、そのほか各種医療データを収集して、管理している。
医療データ受け入れプロセスもELSIの協力を受けてガイドラインを策定した。データ適正利用管理のためにガバナンスデータベースとアクセス制御機能により、医療データおよび学習モデルの適正な利活用も促進する。ELSIグループでは生成AI開発フェーズ、研究フェーズ、利活用フェーズなど、各フェーズに分けて大きく4つの項目を検討した。その結果や提言は、700ページに及ぶ報告書を公開予定だという。
開発のための運用制度を作ることで多くの研究者が各種データやモデルを容易に利用可能になり、今後、利活用が進むと考えていると述べた。合田氏は「世界的にもオープンサイエンスの波が来ている。一部の研究者だけで課題が解決できる時代ではないので、積極的に共有して利活用できるようにしないと立ち遅れる」と語った。
皮膚科領域のLMM構築と社会実装への挑戦
愛媛大学 大学院医学系研究科 教授 藤澤康弘氏
愛媛大学 大学院医学系研究科 教授 藤澤康弘氏は「皮膚科領域LMM構築と社会実装への挑戦」と題して研究内容を紹介した。AMED事業では2019年からオールジャパン体制で皮膚疾患画像ナショナルデータベース(NSDD)を構築するために15大学病院から50万枚の皮膚病画像と10万枚の病理スライドデータを収集した。藤澤氏はその委員長である。そのNSDDを活用したAI活用診療支援システムを開発しようというのがこのプロジェクトだ。
最終的にはLMMの開発が目的だが、そのためには解決しなければならない課題がある。皮膚病の画像は今の管理システムには格納されていない。先生が各々、集めているため、それらとカルテデータを統合しなければならない。それをFHIRリソースから吸い出す必要がある。もう一つは個人情報の問題だ。皮膚病の画像はどうしても個人情報が含まれるため、それをいかに匿名化するか。三つ目はどうしても最終的に削れない個人情報もあるので、それら個人情報が残っているものに対してもクローズドな環境で研究できるようにする。この3つの柱がある。
まずサーバを置いてデータを抜き出すところだが、こちらは国際学会で発表予定となっているとのこと。個人情報のマスキングは、個人情報が含まれていると思われている部分を自動的に検出してマーキングするプログラムを開発した。クローズドな環境でファイルを扱う点については、すでに英国で動いているフレームワーク(TRE)があり、それを参考にして日本に合うように検討した。
LMMの開発は3つのステップで行った。まずイメージエンコーダーに27万枚の皮膚病画像を入力し、皮膚疾患を学ばせた。さらに臨床上間違う可能性の高いリンパ腫やアトピー性皮膚炎などをうまく分けられるよう5万枚の画像を使って、さらに学習させた。最後にLLM-jpに学ばせたところ、最終的な正確度は0.857となった。
画像を入力すると診断結果が出てくるわけだが、学習後は状態を正確に説明し、回答(分類)するようになった。
学会発表だけではなく、最終的には社会実装を目指す。さまざまな企業と話を進めているという。具体的には、前述のように現在のカルテシステムには皮膚病の画像は入力されていないため、そのような活用されていない皮膚情報をきちんとカルテの中に取り込み、画像とセットで活用できるカルテシステムをメーカーと開発する話し合いが進んでいるという。
また、ある製薬会社からは、患者自身が写真を撮り、そのデータをもとにAIがどの皮膚病の可能性があるかを提案するような仕組みを作りたいという相談を受けており、大きな疾患に対してはチャンスがあるのでは、と考えていると述べた。
日本語版医療LLMの開発ならびに臨床現場における社会実装検証
さくらインターネット株式会社 さくらインターネット研究所 上級研究員 小西史一氏
さくらインターネット株式会社 さくらインターネット研究所 上級研究員の小西史一氏は「日本語版医療LLMの開発ならびに臨床現場における社会実装検証」と題して講演した。
小西氏らは、まずオープンな汎用モデルからスタートし、それに継続事前学習させて日本語医学知識を備える汎用医療LLMを作り、それを各医療ケースに合った指示学習をさせることで用途特化のモデルを構築していった。
ユースケース1は「6情報変換」。病院固有の電子カルテデータを標準マスタにマッピングし、任意形式でエクスポートできるようにする。電子カルテのハウスコードや表記ゆれなどをマッピングするときに、今までは人力作業だった負担をできるだけ軽減することを目指す。
2番目のユースケースは「レセプトデータの修正」。請求するために人手で確認・修正している作業にLLMを介在することで作業負担を軽減させる。
これらの作業を進めるにあたり、まずモデルに対する継続事前学習の効果を測るために、医療用コーパスを使って学習させた。その結果を、IgakuQAによるベンチマークで86.7%を達成し、昨年のモデルよりも向上していることを確認した。さらに継続事前学習だけではなく指示学習をしたときに、最新の医師国家試験において正答率93.3%と、OpenAIのo1に匹敵する性能を達成した。さらにRAGなどを使うと98%まで上げることができることを既に確認済みだという。
「6情報変換」においては、スケジュール上の制約で2情報の変換について取り組んだ。感染症検査の検査を想定し、抗体検体検査を標準名称に出力するというもの。継続事前学習、指示学習、プロンプトなどの工夫によって、提案モデルは従来モデルを大きく上まわる性能を達成し、94.6%を達成。これはほぼ人間同等にあたる。小西氏は「どうすればこのようなレベルに達成できるかのノウハウを蓄積できたので残り4情報にも同様の手法でやれるのではないかと自信を持っている」と語った。
二つ目のユースケースである「レセプト修正」については同様に相対的に非常に高い性能を出せることがわかった。修正要否において30.9%のF1スコアを達成した。コメントの質も高かった。
最後にまとめとして上記の内容を再度強調したあと、苦労した点として次世代医療基盤法に基づく匿名加工情報の調達に苦労し、開発スケジュールが大きく圧迫されたことを挙げ、「この種の医療データを扱う上では時間がかかることがよくわかった」と述べた。
LLM/LMMを用いた包括的な画像診断のレポーティング支援システムの構築
神戸大学大学院 医学研究科 内科系講座 放射線医学分野 教授 村上卓道氏
神戸大学大学院 医学研究科 内科系講座 放射線医学分野 教授の村上卓道氏は「LLM/LMMを用いた包括的な画像診断のレポーティング支援システムの構築」と題して講演した。レントゲンと頭部CT画像を使い、LLMを使うことで画像から読影レポートの下書きを自動生成したり、粗い読影レポート所見からも診断欄を自動生成したり、読影レポートから重大イベントをLLMで検出するという研究を行った。今日、問題になっている、主治医が見落とした重大所見が半年後に見つかって訴訟になるという問題を解決することを目的としている。
DICOMデータから画像を取り出し、その画像からレポートを生成し、医師が編集したあと、レポートを自動要約し、所見から重大イベントがあったら自動検出を行う。
LMMを用いて画像から読影レポートの下書きを自動生成する研究は神戸大学でLMMをMIMIC-CXRのレントゲン写真でファインチューニングした。読影レポート所見欄から診断欄を自動生成する研究については約100万件のレポートについて3つのモデルにファインチューニングを行った。結果はLlama3.0 ELYZA 8Bで良好な結果が得られた。読影レポートから診断欄を自動生成する研究については近畿大学で3000件の翻訳済み日本語レポートとT5のファインチューニングを使って診断欄生成AIを作成した。
重大イベントを検出する研究においては、神戸大学で1000例弱の重大イベントありのレポートを収集し、4種類のLLMでファインチューニングを行った。Llama3.0 ELYZA 8Bでもっとも良い結果が得られた。また、神戸大学とは独立に東大でも開発を行った。こちらでは学習済みBERTをベースに5年間の重大イベントありレポートを使って予測モデルを構築した。ROC-AUCが0.89の高精度だったが、東大のモデルを使って神戸大学のデータセットで評価したところ、AUCは0.86となった。村上氏は「このシステムは非常にいいものだと考えている」と語った。
循環器救急領域におけるLLM/LMMアプリケーションの構築を通した個別化医療の実現に関する研究
東北大学 未来型医療創成センター/東北メディカル・メガバンク機構 教授 荻島創一氏
東北大学 未来型医療創成センター/東北メディカル・メガバンク機構 教授の荻島創一氏は「循環器救急領域におけるLLM/LMMアプリケーションの構築を通した個別化医療の実現に関する研究」と題して講演した。話題は大きく二つに分かれており、一つ目は救急外来システムにおけるSpeech to Text LMM技術の社会実装。二つ目は個別化医療への活用を可能とするLLMアプリケーションの概要。前者は救急の現場において音声情報からいかにテキスト化して文章化タスクをシステム化するかという課題だ。後者は、構造化されていないカルテ情報をいかに構造化するかという課題である。
TXP Medical株式会社 代表取締役医師 園生智弘氏
救急部門システムのSpeech to TextについてはTXP Medicalの代表取締役で医師の園生智弘氏が説明した。救急医療現場で医療情報を適切な形で構造化して記載するには入力揺れの統一や医療用語の修正を行う必要がある。それをアプリ上で行い、QRコードを使って電子カルテと連携する。具体的にはSpeech to TextはAzure上に構築したWhisperを用いて文字起こしし、独自辞書を使って医療用語に変換する。さらにそのテキストをGPT-4を使って電子カルテの項目に沿って構造化し、QRコードに変換してリーダーで読み取り、カルテに転記するというシステムだ。園生氏は実際にデモを交えて紹介した。
技術の評価については10症例について行った。5人の医師があらかじめ用意した10症例の台本を読み上げて、そのテキスト化をOpenAI WhisperとAzure Speech to Textで行う。この2種類の結果に対してGPT-4で構造化を行い、精度を比較した。検証の結果、正答率は8割から9割。実際には現場でも使えそうなレベルに達していると判断しているという。
個別化医療への活用を可能とするLLMアプリケーションについては再び荻島氏が解説した。東北大学バイオバンク・メディカルバンク機構における電子カルテの医療情報をもとに、LLMを使った重症度/病型分類やバイタルなどの抽出および、経時的な患者情報の見える化を目指した。これによって、今まで利活用できなかった診療データにアプローチして、診療・臨床研究現場の効率化と質の向上に貢献する。
荻島氏もデモを交えて紹介した。活用したモデルは富士通とCohereが開発した「Takane」。患者集団を層別化して非常に精緻な病態分類をするといったことができる。東北大では詳細なカルテをエキスパートが見て記録している。その実データで比較を行ったところ0.85程度の精度を出すことができた。こちらは今後、富士通でアプリケーション開発が進んでいるという。
「手のひらで使える」実践型生成AI活用アプリケーションの開発
株式会社アルム代表取締役社長 坂野哲平氏
株式会社アルム代表取締役社長の坂野哲平氏は「『手のひらで使える』実践型生成AI活用アプリケーションの開発」と題してアプリケーションをいかに実装するかという観点から講演した。坂野氏は多くのユーザーが使用している医療ICTアプリ「Join」、PHRアプリ「MySOS」、地域包括ケアアプリ「Team」、電子問診票「今日の問診票」などをまず紹介した。これらのチャットAIにLLMを組み合わせることで、専門医の回答作成支援や診療の必要文書作成を行ったり、届出や給付金の申請など行政手続きの補助、看護師の入力記録からの報告書自動作成などを大規模に検証した。基本的に広く活用されているこれらのアプリをそのまま使えるだろうという評価をもらったという。坂野氏は「非常に評価が高かった」と語った。
まず「Join」は6万人の医師が使用しているアプリで、各モダリティから情報を取得することもできる。これに対してLLM/LMMを連携させた「Join Talos」を新規に開発した。診断支援、合併症管理、治療プラン立案、業務効率化などをユースケースとして検証を行った。
保険・行政支援についてはカルテをOCRで読み込み、自動的に感染症発生レポートを作成することに取り組んだ。またデータから肝炎の保険給付金書類の自動作成なども行った。「9割がた、このまま活用できる」と言われているという。
看護師の業務支援にも取り組んだ。訪問看護の記録から報告書を作成する。また申し送りのサマライズなどを行い「使い勝手がいい」という評価を受けたと述べた。
アルムでは社会実装から逆算してテーマに取り組む一方、どのようにマネタイズが可能なのか、社会ニーズから調査することにも取り組んでいるという。また多職種連携システムやSIPの人協調ロボティクスデータベース、PHR流通基盤間でデータ連携するシステムなども開発しており、センサーなども使って急性増悪検知システムなどを開発し、さらに深い患者の見守りに繋げようとしていると述べた。また地域連携や家族側の負担状況も見るといった形でシステム連携しようとさせているという。(続く)
コメント
この記事へのトラックバックはありません。
この記事へのコメントはありません。