医学部成績評価システムに関するスコーピングレビュー：段階評価 vs 合格/不合格制

Should Medical School Grading Be Tiered or Pass/Fail? A Scoping Review of Conceptual Arguments and Empirical Data.

Iyer, Alexander A.; Hayes, Cameron; Chang, Bernard S. MD; Farrell, Susan E. MD, EdM; Fladger, Anne MLS; Hauer, Karen E. MD, PhD; Schwartzstein, Richard M. MD.

Academic Medicine ():10.1097/ACM.0000000000006085, May 12, 2025. | DOI: 10.1097/ACM.0000000000006085

journals.lww.com

研究概要

目的: 医学部の成績評価システム（段階評価 vs 合格/不合格）に関する概念的議論と実証データを体系的に整理
方法: 4つのデータベースから822件の文献を検索し、最終的に40件を分析
評価: MERSQI（医学教育研究品質評価ツール）を使用して研究品質を評価

主要な発見

10の評価領域

ドメイン1: 学生の健康状態（Student Well-being）

合格/不合格制支持の概念的議論:

ストレス軽減、燃え尽き症候群の防止
学生間の協力・結束の促進

段階評価支持の概念的議論:

レジデンシー選考での差別化による不安軽減
一部は段階評価がストレスを生むが成績向上・臨床実践評価ストレスへの準備になると主張

ドメイン2: 学習動機と教育環境（Motivation and Educational Climate）

学習動機への影響:

合格/不合格制支持: 生涯学習・内発的動機の促進、成人学習原理との整合、自己効力感向上
段階評価支持: 学習インセンティブの向上、特に合格ライン以上での努力・内発的魅力のない分野での動機付け

習熟志向学習の促進:

概念的議論: 合格/不合格制が習熟志向学習・成長マインドセットを促進し、成績より改善を重視
学習環境への影響:
- 学生: 真正な関与促進、チーム包含促進、上司との異議申し立て許可
- 教員: 成績判定より習熟促進に集中、「門番」から「コーチ」への役割転換

ドメイン3: 学習成果と優先事項（Learning Outcomes and Priorities）

学習・達成度測定値への影響:

合格/不合格制支持: 学習や各種成績測定値（課程成績、後続実習成績、標準化試験スコア、将来のレジデンシー・専門成績）を低下させない
段階評価支持: 学業成績、標準化試験スコア、レジデンシー・専門成績の向上

医学知識を超えた能力の促進:

合格/不合格制支持:
- 段階評価は医学知識を過度に重視する可能性
- 心理社会的技能・道徳的/専門的アイデンティティ発達の促進
- 協調的現代臨床環境への準備
- 重要分野（健康格差、政策）探求の許可

ドメイン4: 妥当性と信頼性（Validity and Reliability）

段階評価の妥当性:

批判的観点:
- 主観的印象・臨床能力無関連要因（外向性等特定性格特性）に依存
- 改善や臨床実践複雑性を捉えられない
- レジデンシー・臨床成績を予測しない可能性
支持的観点: 学生differentiation、後続課程・実習・標準化試験・レジデンシー・臨床実践成績予測

段階評価の信頼性:

批判的観点: 特に臨床実習での不正確性・信頼性不足（患者変動性、指導者変動性、観察頻度不足）
支持的観点: 十分な信頼性、複数成績平均化による信頼性向上

ドメイン5: 公平性と公正性（Fairness and Equity）

合格/不合格制による公平性向上:

概念的議論:
- 特に臨床実習でのバイアス（人種、性別）軽減・公平性向上
- 医学前教育優位性のない学生（家族に医師なし、理科教育少）への平等機会促進
- 可能な下流利益: 専門分野間多様性増加、ステレオタイプ脅威軽減
反対観点: 合格/不合格制単独ではバイアス・ステレオタイプ脅威軽減しない可能性、成績評価から追跡困難な評価要素（レジデンシー選考時非公式会話）へのバイアス転移

ドメイン6: 学生・学校へのフィードバック（Feedback to Students and Schools）

段階評価によるフィードバック提供:

概念的議論:
- 学生の成績についてのフィードバック提供
- 教員・学校の教育についてのフィードバック提供
- 修復必要学生の特定向上
概念的反論:
- 合格/不合格臨床前成績評価は学生進歩追跡（試験スコア使用等）を妨げない
- 段階評価は特定行動情報提供せず、課程・実習特異的で、課程・実習完了後のみ授与されるため限定的フィードバックのみ

ドメイン7: 社会への説明責任（Accountability to Society）

概念的議論: 段階評価が社会への学生成績重要情報提供の可能性

ドメイン8: 学生の選好（Student Preference）

概念的議論:

合格/不合格制: 主に臨床前カリキュラム文脈で学生満足度向上・医学部入学歩留まり向上仮説
段階評価: 経験学生（サブインターン等）は段階評価を好む可能性

ドメイン9: レジデンシー選考（Residency Selection）

学生の競争力への影響:

段階評価支持: レジデンシー応募強度増加、学生差別化支援
合格/不合格制支持: 反対意見

レジデンシー応募評価方法への影響:

段階評価支持:
- 特に臨床実習成績が客観的・有用な成績データ提供
- 高達成学生（差別化）・低達成学生（不適合レジデンシーマッチ防止）に利益
合格/不合格制批判:
- 標準化試験スコア・医学部威信への過度依存促進
- 一般的・主観的・バイアス可能性のある叙述要約・Medical Student Performance Evaluationへの依存増加
合格/不合格制支持:
- 一貫性なく（校内外）膨張した段階評価への重点軽減
- 包括的審査促進、レジデント-プログラム適合増加可能性

レジデンシー選考効率性:

段階評価支持: レジデンシー選考効率性増加仮説
反論: レジデンシープログラムは質的コメントより効果的・効率的使用学習・他方法での審査効率性改善必要

レジデンシー選考委員会の視点:

概念的議論: レジデンシーディレクターは合格/不合格制に反対・段階評価審査を好む可能性

ドメイン10: 実現可能性と物流（Feasibility and Logistics）

意思決定・実装物流:

概念的議論:
- 教員は段階評価により快適で合格/不合格支援態度変更困難
- 合格/不合格制は労働集約的（叙述評価訓練等）・十分評価されていない
反論: 強力実証証拠なしに段階評価優先はデフォルトバイアス反映

医学部段階別適合性:

概念的議論: 医学部早期段階で合格/不合格制、後期段階（特にレジデンシー適性最近似のサブインターンシップ）で段階評価実装提案

確実性の高い知見

高い確信度: 質の高いフィードバックは特定の成績システムを必要としない
中程度の確信度:
- 合格/不合格制（臨床前）は健康改善と学業成績維持に関連
- 段階評価には人種・性別格差が存在
- 個別の段階評価は信頼性が低いが、複数評価の平均で改善

不確実性の高い領域

ストレスの他領域への転移
異なる学習優先事項の強調
臨床実習での合格/不合格制の影響
卓越性の文化への影響
レジデンシー応募への影響

具体的推奨事項

第一の推奨: 段階評価の慎重な解釈

根拠: 歴史的妥当性データは現代の段階評価構造に適用困難
信頼性の問題: 頻繁でない観察と信頼性向上のための複数評価（5-10個）平均化の必要性
実装: 頻繁な多様臨床課題観察と縦断的データ統合を含む評価プログラム

第二の推奨: 格差への対応

現状: 小さな効果サイズでも他の不利と複合して大きな下流結果
今後の研究: 臨床前成績統制によるドライバー解明
学校の責任: 段階評価継続校は格差の透明性確保と格差拡大政策の回避

第三の推奨: 包括的意思決定

避けるべき: 狭い議論セットへの依存
必要事項: 理論的・実証的根拠に基づく透明な意思決定
システムレベルアプローチ: 成績評価を一側面とする包括的評価アプローチ

研究の限界

検索戦略の限界
段階評価システムの多様性
合格/不合格システムの多様性
学校特有の文脈の考慮不足

結論

医学部の成績評価は複雑な問題で、10の領域にわたって議論が分かれています。この研究は、意思決定者が文献を整理し、将来の研究方向を示し、学習者と患者に利益をもたらす評価システムの構築を支援することを目的としています。

医学教育つれづれ

医学教育に関する論文のPOINTを書き出した備忘録的なブログです。最近はyoutubeも