Publicerad: 2015-11-09 17:05 | Uppdaterad: 2015-11-09 17:19

Komplex grammatik i det genetiska språket

En ny studie från Karolinska Institutet visar att ”grammatiken” i vår genetiska kod är mer komplex än i de mest intrikat uppbyggda språken i världen. Resultatet som publiceras i tidskriften Nature förklarar varför det är så svårt att dechiffrera det mänskliga genomet – och bidrar till ökad förståelse för hur genetiska skillnader kan påverka sjukdomsrisk på individnivå.

– Generna innehåller all den information som behövs för att bygga och upprätthålla en organism, men även detaljer om individens risk att utveckla vanliga sjukdomar som diabetes, hjärtkärlproblem och cancer. Om vi kan bli bättre på att läsa och förstå vårt eget genom, kan vi också i större utsträckning dra nytta av den snabbt ökande mängd genetiska data om olika sjukdomar som forskningen genererar för att utveckla nya behandlingar, säger studiens förstaförfattare Arttu Jolma, doktorand vid institutionen för biovetenskaper och näringslära.

Kartläggningen av det mänskliga genomet år 2000 avslöjade ordningen på de 3 miljarder bokstäver (A, C, G och T) som arvsmassan i våra celler är uppbyggd av. Men att bara känna till ordningen på bokstäverna räcker inte för att ta fram nya läkemedel och behandlingar; man måste också förstå vad bokstavssekvenserna betyder. Det är alltså nödvändigt att identifiera ”orden” och ”grammatiken” i det genetiska språket.

Alla celler i kroppen har i stort sett identiskt genom i cellkärnan, men skiljer sig ändå från varandra genom att olika gener är aktiva (uttrycks) i olika typer av celler. Varje gen har en regulatorisk region som innehåller de instruktioner som styr var och när genen ska användas. Den här genreglerande koden läses av en särskild grupp proteiner, så kallade transkriptionsfaktorer, som känner igen och binder till specifika bokstavssekvenser eller DNA-ord – och antingen ökar eller minskar aktiviteten hos den anknutna genen.

Sammansatta DNA-ord

Under ledning av professor Jussi Taipale, har forskare vid Karolinska Institutet tidigare identifierat de flesta av de DNA-ord enskilda transkriptionsfaktorer binder till. Precis som i mänskliga språk sammanfogas DNA-ord ofta till längre, sammansatta ord som läses av kombinationer av transkriptionsfaktorer. Hur läsningen av dessa sammansatta DNA-ord går till har varit okänt. I sin senaste studie, som nu alltså publiceras i Nature, har Jussi Taipale och hans kollegor därför undersökt hur transkriptionsfaktorer arbetar i par och skaffat sig en systematisk bild av vilka sammansatta DNA-ord dessa par binder till.

Forskarnas analys avslöjar att grammatiken i den genetiska koden är mycket mer komplex än i de mest avancerade tal- och skriftspråken. Istället för att ta bort ett mellanrum mellan två ord och på så sätt bilda ett sammansatt ord är DNA-orden ofta förändrade inom sammansättningen, vilket leder till ett stort antal helt nya ord.

– I vårt arbete har vi identifierat många sådana sammansatta DNA-ord, vilket ökar förståelsen för hur gener regleras i normal utveckling respektive cancer. Resultaten banar väg för att helt knäcka den kod som kontrollerar hur våra gener uttrycks, säger Arttu Jolma.

Jussi Taipale är som forskare även knuten till Helsingfors universitet, Finland. Forskningen har finansierats med anslag från Finnish Academy CoE in Cancer Genetics, Centrum för innovative medicin, Knut och Alice Wallenbergs stiftelse, Göran Gustafssons stiftelse samt Vetenskapsrådet.

Publikation

DNA-dependent formation of transcription factor pairs alters their binding specificity
Jolma A, Yin Y, Nitta KR, Dave K, Popov A, Taipale M, Enge M, Kivioja T, Morgunova E and Taipale J
Nature online 9 November 2015, doi: 10.1038/nature15518