Factors Associated with Higher NBME Practice and Shelf Exam Scores in the Internal Medicine Clerkship.
Newman, J., Rouse, M., DeBauge, A. et al.
Med.Sci.Educ. (2025). https://doi.org/10.1007/s40670-025-02519-0

研究の背景
NBMEが実施する科目試験(Shelf exam)は、米国の医学生にとって極めて重要な評価である。多くの医学部では、この試験の成績が実習の最終成績に組み込まれ、進級や卒業の要件となっている。特に内科では、この試験内容がUSMLE Step 2 CKと大きく重複しており、レジデンシー選考において最も重要な試験の一つとされている。
しかし、Step 1試験が合否判定のみとなったことで、NBME科目試験の成績予測がより困難になっており、学生関連因子とクラークシップ関連因子の両面から検討することが求められていた。
研究方法
本研究は、大規模大学病院の単一施設において、2023-2024年度に内科クラークシップを履修した126名の医学生を対象としたコホート相関研究である。実習中間と終了時のアンケート調査から得られた因子と、模擬試験および本試験の成績との関連を分析した。
調査項目には、ローテーションの時期や配属サービス、指導医、RIME評価での自己評価、フィードバックの量、ストレスレベル、自主学習方法(問題集やANKIの使用状況)などが含まれた。
主要な知見
107名の学生(回答率85%)の分析から、以下の結果が得られた:
成績向上と関連した因子
問題演習の効果
- 実習中間時点(5週目終了時)までに完了した問題数が1標準偏差分(約584問)増加するごとに、NBME科目試験の得点が1.51点上昇した(95%信頼区間 0.22-2.80)
- 実習終了時までに完了した問題数が1標準偏差分(約320問)増加するごとに、得点が1.30点上昇した(95%信頼区間 0.01-2.59)
- 中間模擬試験で1点高いごとに、本試験で平均1.28点高くなった(95%信頼区間 0.90-1.66)
問題集の選択
- 99.1%の学生がUWorld問題集を使用していた
- UWorld以外の問題集を使用した学生は平均6.69点低かった(95%信頼区間 -11.35から-2.03)
成績と関連しなかった因子
注目すべきことに、以下の因子は統計的に有意な関連を示さなかった:
- ANKIフラッシュカードの使用(57.9%の学生が使用していたにもかかわらず)
- RIME評価における自己評価の正確性
- ローテーションの種類(入院患者、コンサルト、外来など)
- ストレスレベル
- 担当指導医
- 個別フィードバックの強度
実践的な示唆
この研究から、クラークシップディレクターは学生に対して以下のようなアドバイスができる:
- 問題演習の重要性: 平均398問の追加問題を完了することで、1.3点の得点向上が期待できる。一貫した問題演習の実践が成績向上の鍵である。
- 配属やローテーション順序への過度な懸念は不要: チームや指導医の配属、ローテーションの順序、自己評価の精度、学習方法は成績に悪影響を与える可能性は低い。
- 標準的な問題集の活用: UWorldのような標準的な問題集を継続的かつ徹底的に使用することが、試験対策として効果的である。
研究の限界
本研究は単一施設・単年度のデータに基づいており、他施設や他年度への一般化には注意が必要である。また、問題完了数は自己申告であり、その問題が本クラークシップ専用なのか、他のローテーションやStep 2対策も含むのかは確認できていない。
さらに、年齢や性別などの人口統計学的データが収集されておらず、最近の研究では産婦人科のNBME試験において性別や年齢が成績と関連することが報告されている点も考慮すべきである。
結論
NBME科目試験の継続的使用が予想される中、学生の成績を向上させる因子の研究は極めて重要である。本研究は、標準的な問題集の徹底的な活用が実践的で修正可能な成績向上因子であることを示した。クラークシップの構造的要素よりも、学生自身が制御可能な学習方法に焦点を当てることで、より効果的な試験対策が可能になる。
今後は、複数施設での長期的研究や、ANKIなど他の学習ツールとの関連についても、さらなるデータ収集が必要である。