専門的な医学教育のためのYouTube動画のコンテンツ品質。システマティックレビュー
Helming, Andrew G. MD1; Adler, David S. MD2; Keltner, Case MPH3; Igelman, Austin D.4; Woodworth, Glenn E. MD5
著者情報
アカデミック・メディシン 2021年10月 - 第96巻 - 第10号 - p 1484-1493
doi: 10.1097/ACM.0000000000004121
目的
専門的な医学教育を目的としたYouTube動画のコンテンツ品質を、Quality rating tool(QRT)のスコアに基づいて評価し、動画の特徴、エンゲージメント指標、著者のタイプが品質に関連するかどうかを判断する。
方法
著者らは、専門的な医学教育を目的としたYouTube動画の質に関する英語の研究を、各データベースの開始から2019年4月までに7つのデータベースで検索した。対象とするには、YouTubeが作成された2005年以降に発表された研究である必要がありました。研究は、使用されたQRTの種類(外部で検証されたもの、内部で検証されたもの、限定的なグローバルなもの)に応じて分類された。研究情報、動画の特徴、エンゲージメントメトリクスを抽出しました。動画は、動画作成者のタイプによって分類した。
結果
31件の研究がこのレビューに含まれた。外部で検証されたQRTを用いた研究は3件、内部で検証されたQRTを用いた研究は20件、limited global QRTを用いた研究は13件であった。外部検証されたQRTを使用した研究では、平均スコア/可能性のある合計スコアが1.3/4、26/80、1.7/5であった。内部で検証されたQRTを使用した18件の研究では、QRTの可能性のある合計スコアの平均的な割合を計算または抽出することができたが、平均スコアは44%(範囲:9%~71%)であった。学術的な医師が著者の動画は、非学術的な医師やその他の著者の動画よりも、内部的に検証されたQRTの平均スコアが高かった(46%);P < 0.05)。
考察
このシステマティックレビューでは、専門的な医学教育を目的としたYouTube動画の品質を調査した31の研究を確認しました。このレビューでは、動画のQRTスコアに大きなばらつきがあり、QRTスコアの低い動画が多く、スコアの高い動画はほとんどありませんでした。このレビューに含まれる18件の研究では、内部で検証されたQRTを使用しており、QRTスコアの平均的な割合を計算または抽出することができましたが、平均スコアはわずか44%で、最高スコアは71%でした。さらに、このレビューに含まれるいくつかの研究では、多くのビデオに明らかな誤りや誤った情報が掲載されていることが報告されています。
医学生や研修医が医療訓練のために十分なコンテンツ品質の動画を識別し、それだけを利用できるかどうかは不明です。情報源の信頼性については、今回のレビューで、学術的な医師の著者が投稿した動画は、統計的に有意に高い品質を有していましたが、これらの動画の品質には大きなばらつきがあり、コンテンツの品質スコアが低いものも多くありました。このレビューでは、動画の持続時間という特性を除き、動画の特性やエンゲージメント指標と、動画のコンテンツ品質スコアとの間に相関関係は見られませんでした。動画の長さと品質に正の相関があるのは、長い動画では提示される情報量が多いため、対象となった研究で使用された多くのQRTのスコアが高くなったと考えられます。
専門的な医学教育を目的としたYouTubeの動画の品質に関する現在の欠点を解決するために、いくつかの解決策が考えられます。
ひとつは、専門的な医学教育を目的とした動画を制作し、査読を経て公開するよう、学術機関や医師にインセンティブを与えることです。インセンティブとしては,学術振興委員会が査読付きの動画をインターネット上で制作・公開することの価値を認めるという形が考えられます
2つ目の解決策は、標準化された評価システムを使って投稿されたビデオの質を評価し、そのスコアをビデオのページに掲載することである。動画を投稿する前に正式なピアレビューを必要としない場合は、動画を投稿した後に標準化されたツールを使って独立したピアレビューを行う必要があります。
3つ目の解決策は、他の解決策と相互に排他的ではないが、学習者を厳選されたビデオコンテンツのソースに導くことである。このような精選されたコレクションは、UpToDateのような専門学会、ジャーナル、独立組織が提供している場合がある。
結論
今回のレビューでは、専門的な医学教育を目的としていると思われるYouTube上の簡単にアクセスできる動画の多くは、様々なQRTで評価されるように、高品質ではないことが明らかになりました。学術的な医師が作成した動画は、平均して質が高かったものの、その質には大きなばらつきがあり、多くは依然として質が低かった。また、動画の特徴やエンゲージメント指標は、動画の質を測る信頼性の低い代替指標であることがわかりました。動画コンテンツの品質に関する統一的な評価基準がないこと、検索アルゴリズムの最適化が不十分であること、投稿された動画のピアレビューや管理が不十分であることなどが、専門的な医学教育に利用できるYouTube動画の全体的な質の低さにつながっていると考えられます。医学教育コミュニティは、標準化されたQRTを導入し、投稿された動画にスコアを含めること、高品質の教育用動画コンテンツをキュレーションすること、YouTube動画の制作、公開、レビューに対する学術的なインセンティブを与えることが有益であると考えられます。さらに、学習者の検索行動や、専門的な医学教育に適した動画を選択する能力を明らかにするためには、さらなる研究が必要です。