Publicerad: 2022-07-01 14:10 | Uppdaterad: 2022-07-01 14:10

Maskininlärning för precisionsmedicin

Inom precisionsmedicin kan möjligheten att förutsäga risken för en händelse under en viss period hjälpa till att till exempel identifiera patienter som behöver tidig förebyggande behandling. Moderna metoder för maskininlärning inom datavetenskapen är idealiska för att kunna göra dessa förutsägelser.

Porträtt av Pablo Gonzalez Ginestet
Pablo Gonzalez Ginestet Foto: Gunilla Sonnebring

När det gäller medicinska data lider de ofta av så kallad högercensurering av det utfall man studerar, vilket utgör ett hinder för att direkt kunna tillämpa maskininlärningsalgoritmer. En observation sägs vara högercensurerad om patienten levde när studien avslutades eller om patienten av någon anledning hoppade av studien under uppföljningstiden.

I sin avhandling har Pablo Gonzalez Ginestet vid Institutionen för medicinsk epidemiologi och biostatistik arbetat med att utveckla och ta fram metoder för prediktionsmodeller. Dessa metoder är baserade på maskininlärningsalgoritmer som kan hantera högercensurering och även andra konkurrerande risker (engelska: ”competing risks”).

Kan du berätta något om de viktigaste resultaten i din avhandling?

–Det viktigaste resultatet är att våra metoder gör det möjligt att bygga en riskprediktionsmodell som tar hänsyn till censurerade observationer med hjälp av en eller kombinerade maskininlärningsalgoritmer, vilket resulterar i en bättre eller lika bra prediktion som andra metoder som tar hänsyn till censurering.

Varför valde du att forska om just detta?

–Jag var redan intresserad av maskininlärning och min handledare introducerade mig ytterligare till området. Vi ville hitta sätt att anpassa maskininlärningen till miljöer där data lider av högercensurering och där man inte vill utesluta de censurerade observationerna från analys.

Hur tycker du att forskningen ska fortsätta framöver på det här området?

–Det skulle vara intressant att utvidga metodiken för intervallcensurering som förekommer i studier med periodisk uppföljning, till exempel i studier av förvärvat immunbristsyndrom (AIDS) där blodprover tas regelbundet för att fastställa AIDS-debut.

Avhandling

Machine learning methods for precision medicine.”

Pablo Gonzalez Ginestet. Karolinska Institutet (2022), ISBN: 978-91-8016-633-1