医学教育つれづれ

医学教育に関する論文のPOINTを書き出した備忘録的なブログです。

医学生を対象とした病歴聴取時の臨床判断支援システムによる判断精度の向上:無作為化臨床試験

Improving decision accuracy using a clinical decision support system for medical students during history-taking: a randomized clinical trial
Yasutaka Yanagita, Kiyoshi Shikino, Kosuke Ishizuka, Shun Uchida, Yu Li, Daiki Yokokawa, Tomoko Tsukamoto, Kazutaka Noda, Takanori Uehara & Masatomi Ikusaka 
BMC Medical Education volume 23, Article number: 383 (2023) 

bmcmededuc.biomedcentral.com

 

背景
臨床診断支援システム(Clinical Diagnostic Support System:CDSS)は、医学生や医師がエビデンスに基づいた医療を提供することを支援することができる。さらに、CDSSを使用する医学生の診断精度の程度を、CDSSもGoogleも使用しない研修医の診断精度の程度と比較する。

方法
本研究は、無作為化教育試験である。参加者は、2020年5月から12月にかけて千葉大学医学部附属病院総合診療科をローテートした医学生64名と研修医13名である。医学生は、CDSS群(n=22)、Google群(n=22)、対照群(n=20)にランダムに分けられた。参加者は、現病歴を中心とした20症例(一般的な疾患10症例、緊急性の高い疾患10症例)に対して、最も可能性の高い3つの診断を提示するよう求められました。正しい診断には1点(最大20点)が与えられました。3つの医学生グループの平均点は、一元配置分散分析を使って比較された。さらに、CDSS、Google、研修医(CDSS、Googleなし)の各グループの平均点を比較した。

結果
CDSS群(12.0±1.3)およびGoogle群(11.9±1.1)の平均点は、対照群(9.5±1.7、p = 0.02、p = 0.03)に比べて有意に高い値を示しました。研修医グループの平均点(14.7±1.4)は、CDSSグループおよびGoogleグループの平均点よりも高かった(p = 0.01)。一般的な疾患例については、CDSS、Google、研修医の各グループの平均スコアは、それぞれ7.4±0.7、7.1±0.7、8.2±0.7であった。平均スコアに有意差はなかった(p = 0.1)。

考察・結論

本研究では、医学生と研修医が医療診断を行う際に、臨床判断支援システム(CDSS)とGoogleを利用することを分析しました。その結果、医学生はCDSSやGoogleを使用した場合、特に典型的な病歴や一般的な疾患について、より正確に診断できることがわかりました。この精度の高さは研修医と同程度であった。

しかし、救急疾患や複雑な症例では、医学生がCDSSやGoogleのいずれを使用しても、研修医の診断精度を下回ることがわかった。これは、学生が検索キーワードの設定や情報の評価に不慣れであること、あるいは救急医療に対応する機会が少ないことが原因であると考えられるとしている。

また、CDSSとGoogleのどちらを使っても、回答にかかる時間に大きな差は見られなかった。CDSSの定期的な使用と習熟により、診断の精度が向上する可能性があるとしている。

CDSSは、情報を医学用語で表示し、関連するガイドラインや専門家の意見を反映しているという点で優位性を示しました。一方、Googleは、情報源が混在しているため信頼性は低いが、学生にとってより身近で使いやすいと判断された。

本研究では、CDSSの精度向上の必要性と、CDSSを効果的に使用するための高い習熟度の必要性という2つの重要な課題を浮き彫りにしました。

単一施設で実施されたこと、グループの非盲検化による主観的バイアスの可能性、症例の質問が実際の患者の訴えではなく医学用語で構成されていることなど、いくつかの制約はあるものの、本研究は、CDSSとGoogleを使用することで、医学生がより正確な鑑別診断を行うことができると結論付けた。

今後の研究で、より経験豊富な臨床医に対するCDSSの効果を評価することを提案しています。また、CDSSの潜在的な競合として、OpenAIのChatGPTのようなAI駆動型システムにも言及しています。