The educational game SonoQz improves diagnostic performance in ultrasound assessment of ovarian tumors
Erica Smedberg, Måns Åkerlund, Mikael Andersson Franko, Elisabeth Epstein
First published: 31 July 2024 https://doi.org/10.1111/aogs.14906
https://obgyn.onlinelibrary.wiley.com/doi/10.1111/aogs.14906

はじめに
我々の目的は、教育用ゲームSonoQzが卵巣腫瘍の超音波診断における診断能力を向上させることができるかどうかを調べることであった。
材料と方法
SonoQzモバイルアプリケーションは、医師が卵巣腫瘍の静止画像に基づいて超音波診断を練習するための教育ツールとして開発された。 このゲームは、手術前に超音波検査の専門家が検査した324の卵巣腫瘍の画像で構成されている。 参加者がSonoQzアプリで少なくとも200症例を評価するトレーニング段階に先立ち、プレトレーニングテストが行われ、その後にポストトレーニングテストが行われた。 トレーニング前とトレーニング後のテストとして、それぞれ20症例からなる2種類のテスト(AとB)が使用された。 半数のユーザーが最初にテストAを受け、次にBを受け、残りのユーザーは逆の順序でテストを受けた。 利用者は、(1)国際卵巣腫瘍分析(IOTA)簡易規則に従って腫瘍を分類し、(2)良性または悪性に分類し、(3)特定の組織学的診断を提案するよう求められた。 トレーニング前後のテストに固定効果を、参加者と症例に交差ランダム効果を用いたロジスティック混合モデルを用いて、テストのスコア、感度、特異度の改善を判定した。
結果
19の医療施設から58名の医師が参加した。
診断性能の向上:
Simple Rules評価で正しく分類されたケースの中央値が72%から83%に増加(p<0.001)。
良性または悪性の判別精度が86%から95%に増加(p<0.001)。
特定の診断を行う精度が43%から63%に増加(p<0.001)。
感度と特異度:
感度は98%から97%へわずかに減少したが、統計的に有意ではない(p=0.157)。
特異度は70%から89%に増加(p<0.001)。
参加者の自己評価:
自己評価の確信度(0-100スケール)が全ての質問で増加し、Simple Rules評価で51から62、良性または悪性の判別で51から65、特定の診断で37から53(p<0.001)。
考察
本研究の結果は、SonoQzが臨床作業と従来の教育を補完する効果的な教育ツールであることを示しています。特に、良性と悪性を判別する特異度が向上し、高い感度を維持しながら誤判定の数を減らすことができました。
専門家と非専門家の差:
専門医と研修医の間で診断性能の向上に有意な差は見られませんでしたが、研修医の自己評価の確信度は低かったものの、SonoQzの使用後に大幅に向上しました。
ゲームの効果:
SonoQzは、ゲームの要素を取り入れたことで参加者の関心を引き、学習を楽しく効果的にすることができました。これは、医療教育ゲームが学習効果を高める可能性があることを示しています。
限界:
この研究は無作為化対照試験ではなく、参加者が自分自身を対照とするデザインであるため、結果の解釈には注意が必要です。また、ゲームには静止画像のみが使用されており、動画を含めることでさらに実際の検査に近づける可能性があります。
今後の課題:
SonoQzの使用が長期的に臨床パフォーマンスにどのように影響するかを確認するためには、さらなる研究が必要です。また、より多くの医療現場での導入とその効果を検証することが求められます。
結論
この結果から、教育用ゲームSonoQzは、卵巣腫瘍の評価において、特に高い感度を維持しながら偽陽性の数を減少させることにより、診断能を改善しうる効果的なツールであることが示された。

SonoQzの内容と機能
-
画像とデータベース:
- SonoQzには324例の卵巣腫瘍の画像が収録されています。これらの画像は、手術前に超音波の専門家によって撮影されたものです。
- 各ケースには2~4枚の超音波画像(カラー・ドップラー画像を含む場合もある)が含まれ、患者の年齢、腫瘍の最大直径、血流の有無、固形成分のサイズなどの臨床情報が提供されます。
-
評価プロセス:
- 参加者は各ケースについて以下の3つのタスクを行います:
- IOTA Simple Rulesに基づいて腫瘍を評価する。
- 腫瘍を良性、境界悪性、悪性のいずれかに分類する。
- 特定の組織学的診断を提案する。
- 各ケースの後には正しい回答とケースのコメントが提供され、特定の病変特性に関する重要な情報が強調されます。
- 参加者は各ケースについて以下の3つのタスクを行います:
-
トレーニングとテスト:
-
フィードバックとスコアリング:
- 各トレーニングセッションの終わりには、総合スコアが表示され、参加者は自分の進捗を確認できます。