Logo Jan Blom
Login

Oncologisch onderzoek.nl

Externe evaluatie van drie commerciële AI-algoritmen voor beoordeling van screeningsmammogrammen


Dr. Fredrik StrandEen computeralgoritme dat mammogrammen even betrouwbaar als of zelf beter kan beoordelen dan ervaren radiologen zou de effectiviteit van de mammacarcinoomscreening kunnen verbeteren. Een studie van het Karolinska Instituut (Stockholm) heeft het presteren beoordeeld van drie commerciële artificiële-intelligentie (AI)-algoritmen voor het onafhankelijk beoordelen van screeningsmammogrammen. Dr. Fredrik Strand en collega’s publiceren de studie in JAMA Oncology.1


De retrospectieve patiënt-controlestudie was gebaseerd op een double-reader mammografiescreeningscohort in een academisch ziekenhuis in Stockholm. De studie includeerde 8805 vrouwen in de leeftijd van 40 tot 75 jaar, zonder geschiedenis van mammacarcinoom en zonder implantaten, die tussen begin 2008 en eind 2015 mammografiescreening ondergingen. Onder deze vrouwen waren er 739 met (84% bij screening of 16% tijdens een jaar follow-up gedetecteerd) mammacarcinoom en 8066 gezonde controlevrouwen (tijdens twee jaar follow-up vrij van mammacarcinoom). De mammogrammen werden beoordeeld door twee radiologen en door de drie algoritmen (AI-1, AI-2, en AI-3). De drie algoritmen leverden een continue score voor de verdenking van mammacarcinoom, met als afsnijpunt voor nomaal-abnormaal de gemiddelde specificiteit van de first-reader radioloog (96,6%).

De area under the receiver operating curve voor detectie van de ziekte was 0.956 voor AI-1; 0,922 voor AI-2; en 0,920 voor AI-3. Op het niveau van specificiteit van de radiologen was de sensitiviteit 81,9% voor AI-1; 67,0% voor AI-2; 67,4% voor AI-3; 77,4% voor de first-reader radioloog, en 80,1% voor de second-reader radioloog. Combinatie van de beoordeling van AI-1 met die van first-reader radiologen leverde 88,6% sensitiviteit bij 93,0% specificiteit. Geen andere combinatie van algoritmen en radiologen kwam tot een betere sensitiviteit.

De onderzoekers concluderen dat er significante verschillen waren in performance tussen commercieel beschikbare algoritmen. Tenminste één commercieel beschikbaar AI-algoritme kon tenminste even accuraat screeningsmammogrammen beoordelen als radiologen. Combinatie van beoordelingen door AI-algoritmen en radiologen kan wellicht resulteren in de meest accurate beoordeling.

1.Salim M, Wåhlin E, Dembrower K et al. External evaluation of 3 commercial artificial intelligence algorithms for independent assessment of screening mammograms. JAMA Oncol 2020.3321

Summary: A study at the Karolinska Institute (Stockholm, Sweden) evaluated three AI computer-aided algorithms for assessing screening mammograms. One of the algorithms performed more accurate than first-reader radiologists. However, the highest number of cases positive for breast cancer was detected by combining this best algorithm with first-reader radiologists.

Commentaren


Reageren op dit artikel is mogelijk na registratie.  (Login)

Nog geen commentaren