Proteinkodande "skräpgener" kan vara kopplade till cancer
Med hjälp av en ny analysmetod har forskare vid Karolinska Institutet och Science for Life Laboratory (SciLifeLab) hittat närmare hundra nya proteinkodande regioner i arvsmassan hos människa. Ett antal av dessa är så kallade pseudogener som misstänks ha en koppling till cancer. Förhoppningen är nu att proteinanalysmetoden som forskarna utvecklat och som presenteras i vetenskapstidskriften Nature Methods ska öppna för ett helt nytt forskningsfält
Den fullständiga informationen om människans arvsanlag eller gener finns lagrad i DNA-sekvensen i cellkärnan och kartlades i början av 2000-talet. Gener är definierade avsnitt av DNA som kodar för (ger upphov till) olika typer av proteiner. Med hjälp av bland annat DNA-analyser har man på senare år kunnat definiera runt 21 000 proteinkodande gener. I kroppens olika celltyper är olika proteinproducerande gener aktiva eller inaktiva och många sjukdomstillstånd beror dessutom på förändrad aktivitet hos specifika gener.
Hos människan är det bara cirka 1,5 procent av arvsmassan eller DNA som faktiskt kodar för proteiner. Av resterande DNA används en del för att reglera produktionen av protein från gener, men den stora bulken av DNA anses inte ha någon funktion och refereras ofta till som "skräp-DNA". I detta skräp-DNA finns även så kallade pseudogener, icke-funktionella gener som har ansetts vara någon form av rest som blivit kvar under evolutionens gång.
I den nu publicerade artikeln i Nature Methods presenterar forskarna en ny så kallad proteogenomikmetod, som gör det möjligt att hitta nya proteinkodande gener i resterande 98,5 procent av arvsmassan. Något som alltså tidigare inte varit möjligt. Forskningen visar bland annat att vissa pseudogener är proteinproducerande och därför funktionella.
– För att göra detta fick vi matcha experimentell data för peptidsekvenser mot miljontals möjliga ställen i hela genomet. Det krävdes både nya laborativa och bioinformatiska metoder för att möjliggöra detta. Men när vi väl hade metoden och arbetsflödet på plats kändes det som ett Jules Verne-äventyr i arvsanlaget, säger docent Janne Lehtiö, som lett arbetet med studien.
Forskarna hittade bevis för nästa hundra nya proteinkodande regioner i genomet. Liknande fynd gjordes även i celler från möss. Många av de proteiner som kodas av pseudogener kunde dessutom spåras i andra cancercellinjer. Nästa punkt på forskarnas agenda är nu att ta reda på om generna i arvsmassans "skräpkammare" kan ligga bakom cancer eller andra sjukdomar.
– Vår forskning motbevisar den gamla tesen att pseudogener inte kan koda för proteiner i och med att vi har hittat evidens för tiotals pseudogenproteiner. Den analysmetod vi har utvecklat skapar nya möjligheter att kartlägga vilka genregioner som kodar för proteiner och öppnar i förlängningen upp för ett helt nytt forskningsfält, säger Janne Lehtiö.
Arbetet med den aktuella publikationen har drivits av ett team av forskare från Karolinska Institutet, Stockholms Universitet och KTH, alla aktiva vid SciLifeLab. Janne Lehtiö, som har lett arbetet, är docent och forskargruppsledare på institutionen för onkologi-patologi vid Karolinska Institutet och även knuten till SciLifeLab. Studien är finansierad med anslag från EU, Vetenskapsrådet, Cancerfonden, Stockholms läns landsting samt Cancerföreningen i Stockholm. GE Healthcare Life Sciences i Uppsala har bidragit med tekniskt stöd för metodutveckling.
Läs ett pressmeddelande om studien
Publikation
HiRIEF LC-MS enables deep proteome coverage and unbiased proteogenomics.
Nat. Methods 2014 Jan;11(1):59-62