Statistiskt verktyg för giltig kausalinferens med färre antaganden
Att kunna dra kausala slutsatser är viktigt i medicinsk forskning för att se om medicinska behandlingar är effektiva och om olika exponeringar är skadliga. Vid insamling av data är det svårt att dra kausala slutsatser och ofta måste forskaren göra orealistiska antaganden om de bakomliggande mekanismerna som genererat data. I en ny artikel publicerad i Journal of the American Statistical Association har forskare vid KI utvecklat statistiska metoder som undviker sådana orealistiska antaganden.
Författarna Erin Gabriel, Michael Sachs och Arvid Sjölander vid Institutionen för medicinsk epidemiologi och biostatistik, beskriver i artikeln hur metoderna kan användas och tolkas.
Nya verktyg för många olika forskningsupplägg
Randomiserade prövningar är en typ av experiment där grupper av frivilliga slumpmässigt antingen får ett nytt läkemedel eller placebo. Sedan jämförs de två grupperna för att bedöma effekten av det randomiserade läkemedlet på patienternas överlevnad, infektionsnivåer och mående. Det finns dock många faktorer som inte kan tilldelas slumpmässigt till människor, till exempel rökning och exponering för asbest, eller sådant som kan randomiseras, men oftast bara studeras i mindre observationsstudier, såsom intag av rött vin och frukt.
I sådana situationer kan effekten av en exponering vara svår att utröna eftersom andra faktorer kan påverka både den studerade exponeringen och dess resultat. Att bo i Sverige är till exempel förknippat med lägre dödlighet och högre konsumtion av hjortron än Ungern, så om man studerar effekten av hjortron på dödligheten hos människor från både Ungern och Sverige kan det se ut som att hjortron minskar dödligheten.
Statistiska metoder med ny ansats
Fast det finns många verktyg för att hantera kända faktorer, till exempel vilket land man bor i, kräver alla dessa att forskaren gissar om alla andra faktorer som inte kan mätas för att göra det möjligt att räkna på dessa faktorers effekter. Det aktuella arbetet använder matematik, logik och statistik för att minska behovet av att gissa och istället för att ge ett enda värde av en effekt, ger det en rad möjliga effektstorlekar. Liknande metoder har utvecklats tidigare, men bara ett fåtal och specifika för typ av insamlad data. Erin Gabriel och hennes medförfattare har utvecklat nya metoder som kan användas vid flera typer av datainsamling, och särskilt vid forskning på de nationella registren i Sverige.
“Dessa statistiska metoder, som är lätta att använda, kan vara till hjälp i många miljöer där det är svårt att dra kausala slutsatser på grund av confounding och/eller selektionsbias,” säger förstaförfattaren Erin Gabriel.
Författarna hoppas nu att deras verktyg kan användas av forskare runt om i världen för att undvika att gissa om omätbara faktorer i insamlad forskningsdata. I deras pågående och framtida arbete strävar författarna efter att skapa och beskriva nya statistiska verktyg som kan användas i kliniska prövningar som inte kan göras helt perfekt när det gäller att mäta exponeringar.
Publication
Titel: Causal bounds for outcome-dependent sampling in observational studies
Författare: Erin E Gabriel, Michael C Sachs, Arvid Sjölander
Tidskrift: Journal of the American Statistical Association
doi: https://doi.org/10.1080/01621459.2020.1832502
arXiv link: https://arxiv.org/abs/2002.10519