ビデオ

ニュース

May 18, 2024

ビデオ

Scientific Reports volume 13、記事番号: 1038 (2023) この記事を引用 1306 アクセス 1 Altmetric Metrics の詳細 満足のいく臨床転帰を確保するには、外科技術の評価を行う必要があります。

Scientific Reports volume 13、記事番号: 1038 (2023) この記事を引用

1306 アクセス

1 オルトメトリック

メトリクスの詳細

満足のいく臨床結果を確保するには、外科技術の評価が客観的で時間効率が高く、優先的に自動化されている必要がありますが、現在はどれも達成できません。 ビデオベースの評価 (VBA) は、技術スキルの実行を評価するために術中およびシミュレーション設定に導入されています。 ただし、VBA は手動で時間がかかり、主観的な解釈が生じやすく、評価者間の信頼性が低くなります。 ここでは、ビデオフィードに基づいて手術スキルの実行に関する一か八かの総括的評価と、外科スキルの習得を導くための低リスクの形成的評価を自動的かつ客観的に提供できるディープラーニング(DL)モデルを提案します。 形成的評価は、手術のパフォーマンスと相関する視覚的特徴のヒートマップを使用して生成されます。 したがって、DL モデルは、ビデオから外科的タスクを定量的かつ再現可能に評価する道を切り開くものであり、外科的トレーニング、認定、および資格認定において広く普及する可能性があります。

外科医のスキルは、外科手術の成功を決定する最も重要な要素です1。 外科技術の評価は形成的または総括的なものである場合があります。 形成的評価はリスクが低いです。 通常、専門家は手術中のガイダンスとしてそれを提供します。 一方、総括評価は、一か八かの証明や資格認定に使用され、通常は試験監督によって計算される定量的なスコアに関連付けられます。 手術室またはシミュレーター上での外科医の直接観察が現在の外科技術評価のゴールドスタンダードであることに変わりはありませんが、ビデオベースの評価 (VBA) への注目が高まっています 2,3,4。 米国外科委員会 (ABS) は、一般外科医および関連専門分野向けの継続認定プログラムのコンポーネントとして VBA を検討しています5。 ただし、事後的な手順として、VBA は手動と時間がかかり、主観的であり、評価者間の信頼性が低下する傾向があります 2,3。 さらに、VBA の方法論では、作業負荷を軽減するためにビデオをスニペットに編集することが多くあり 3、編集者の偏見による主観性が助長されます 2、3。 さらに、多くの研究では、完全なビデオと比較して、編集されたビデオによる有効性の証拠が不十分であり、スコア予測が水増しされていることが報告されています3。 もう 1 つの制限は、VBA はほぼ専ら形成的、つまりリスクの低いものであり、腹腔鏡手術の基礎 (FLS) などの総括的な、つまりリスクの高い評価 3 に VBA を使用することに関して文献には顕著なギャップがあることです。 したがって、VBA に対する客観的で効率的かつ自動化されたアプローチを開発する必要があります。

自動化された客観的なスキル評価 6 のために、いくつかの深層学習 (DL) モデルが開発されていますが、そのほとんどは外科医からセンサーベースの運動学データを取得することに依存しています。 これには時間と労力がかかり、外科手術に支障をきたす可能性があります。 対照的に、ビデオはほとんどの外科手術の一部として日常的に収集されるため 2、大規模なデータ収集が可能になります。 既存のビデオベースの DL モデルは、問題を単純化するために編集を利用しています 7,8。 さらに、これらのモデルは、各スニペットが完全なビデオのラベルを共有するラベル保持スニペットを使用します。 ビデオ全体のラベルが個々のスニペットに適用されない可能性があるため、これには問題があります。 最後に、現在の DL モデルには、パフォーマンスを特徴付ける顕著な特徴を評価する手段がありません。 クラスアクティベーションマップ(CAM)11などの説明可能な人工知能(XAI)技術9、10は、これに対処できます10、12。 それにもかかわらず、それらが信頼性の高い形成的評価を提供することは示されていません。

これらの制限に対処するために、我々は、完全な手術ビデオ シーケンスを利用して、合計的な手術スコアを提供し、手術のパフォーマンスに基づいて形成的フィードバックを生成できる DL モデルであるビデオベース評価ネットワーク (VBA-Net) を提案します。 図 1 は研究の概要を示しています。 VBA-Net の開発には、外科的パターン切断 (PC) を含む 2 つのデータセットが使用されました (図 1a)。 さらに、モデルの一般化可能性を解明するために、最も一般的に使用されている公開データセットである JIGSAWS6,13 でベンチマークを実行しました。 最後に、CAM を介して形成的フィードバックを提供し、その顕著性を検証するためのモデルに依存しない統計ツールを提示しました。