Feasibility study of using GPT for history-taking training in medical education: a randomized clinical trial
Zhen Wang, Ting-Ting Fan, Meng-Li Li, Nin-Jun Zhu & Xiao-Chen Wang
BMC Medical Education volume 25, Article number: 1030 (2025)
従来の医学教育の課題
医学教育において、病歴聴取は構造化された患者の医学的背景を聞き出すプロセスとして定義され、主訴、現病歴、既往歴、関連する社会歴・家族歴の収集を含む基本的な臨床スキルです。しかし、従来の対面式病歴聴取訓練には以下の限界がありました:
- リソース集約的: 指導者への依存度が高く、コストがかかる
- 標準化の困難: 大規模な実施における一貫性の確保が困難
- 実践機会の制限: 臨床実習開始前の学生は直接的な患者面接の機会が少ない
- 医患関係の緊張: 実際の患者を使った訓練の実現可能性の低さ
AI技術の医学教育への応用
近年、ChatGPTを含む大規模言語モデルの医学教育への統合が注目されています。例えば:
- Holderried et al.:GPT搭載の模擬患者プラットフォームによる自動フィードバック提供
- Brügge et al.:AIベースの患者シミュレーションによる臨床意思決定とインタビュータスクの有意な改善
研究方法
- 対象: 安徽医科大学の5年生56名
- 研究デザイン: 単施設無作為化比較試験
- グループ分け: GPTシミュレーション群(28名)と従来のロールプレイング群(28名)
- 訓練期間: 4週間、週3回、各30分セッション
- 評価方法: 構造化臨床試験(OSCE)による病歴収集、臨床推論、コミュニケーションスキル、専門的行動の評価
主な結果
1. 臨床試験スコア
- 訓練前: GPT群 57.39±11.14点、対照群 54.68±10.33点(有意差なし)
- 訓練後: GPT群 86.79±5.46点、対照群 73.64±4.76点(P<0.001)
- 効果量: Cohen's d=2.57(大きな教育効果)
2. 教育効果に関する評価
GPT群の学生は対照群と比較して以下の項目で有意に高いスコアを示しました:
- 自主学習の向上(P=0.004)
- 学習意欲の向上(P<0.001)
- コミュニケーション・フィードバック能力の改善(P=0.006)
- 面接時の論理的推論能力の向上(P=0.036)
- 面接時の不安軽減(P<0.001)
3. 学生満足度調査
GPT群は以下の項目で有意に高い評価を示しました:
- 遭遇した疾患の多様性(P=0.004)
- 訓練方法の使いやすさ(P<0.001)
- 他者への推奨意向(P<0.001)
GPTシステムの特徴
- 内科学教科書、診断医学書、医療記録作成ガイドラインを学習データとして使用
- リアルな臨床場面を模擬し、曖昧な表現や話題の逸脱など実際の患者とのコミュニケーションの課題を再現
- 各シミュレーション後に4つの評価軸(病歴の完全性、臨床推論、コミュニケーション、専門的行動)に基づく自動フィードバックを提供
研究の意義と限界
意義
- GPTベースの訓練が従来の方法より効果的であることを実証
- 学習者の自律性と学習意欲の向上
- 標準化された訓練の提供が可能
- 不安軽減による学習環境の改善
限界
- 単施設での小規模研究
- 短期的な追跡期間
- 非言語的コミュニケーション(表情、ジェスチャーなど)の欠如
- 評価者間信頼性の正式な測定が不十分
今後の展望
主要な研究成果
本研究は、GPTベースの病歴聴取シミュレーションが医学生の病歴聴取スキル向上において有望な効果を実証しました。特に以下の点で重要な貢献をします:
医学教育への示唆
- スケーラブルな教育ソリューション: リソース制約下での効果的訓練提供
- 標準化された学習体験: 一貫した高品質教育の実現
- 学習者中心アプローチ: 自律性と個別化学習の促進
- 従来手法の補完: 既存教育システムの強化ツールとしての位置づけ