Ինչո՞ւ մենք բոլորս միանման չենք։ Ինչո՞ւ մեկն ունի ոսկեգույն, մյուսը՝ շագանակագույն մազեր, ինչո՞ւ է մեկը բարցրահասակ, մյուս՝ ոչ։
Այս բոլոր հարցերի պատասխաններն ունի մարդու կարևորագույն մոլեկուլը՝ մարդու ԴՆԹ-ն (Դեզօքսիռիբոնուկլեինաթթու)։ Բայց նախքան դրանց անցնելը հասկանանք, թե որտեղ է գտնվում այդ մոլեկուլը և ինչու է այն այդքան կարևոր։
ԴՆԹ՝ ամենակարևոր մոլեկուլը
Մարդը, ինչպես նաև այլ կենդանի օրգանիզմները, կազմված են բազմաթիվ բջիջներից։ Բջիջներում կա կորիզ, որտեղ տեղակայված են մարդու քրոմոսոմները։ Հավանաբար կենսաբանության դասընթացից կհիշեք քրոմոսոմների մասին։ Մարդն ունի 23 զույգ քրոմոսոմ, որոնցից մեկը մարդը ժառանգում է մի ծնողից, երկրորդը՝ մյուս ծնողից։
Հասանք կարևորին․ քրոմոսոմներն էլ իրենցից ներկայացնում են ԴՆԹ-ի և սպիտակուցների փաթույթ։
Եկեք հասկանանք ԴՆԹ-ի կառուցվածքը։ ԴՆԹ-ն երկպարույր շղթա է և իրենից ներկայացնում է նուկլեոտիդների հաջորդականություն (տես նկարը)։
Նուկլեոտիդներն իրենց հերթին պարունակում են այսպես կոչված ազոտական հիմքեր, որոնք չորսն են՝ Ադենին, Թիմին, Գուանին և Ցիտոզին, և նշանակվում են համապատասպանաբար A, T, G և C տառերով։ A,T,G և C միասին կազմում են ԴՆԹ-ի «աստիճանները» և նրանց միջև գործում է կոմպլիմենտարության սկզբունք, այն է ՝ A-ի դիմաց միշտ պետք է լինի T-ն և հակառակը, G-ի դիմաց միշտ պետք է լինի C-ն և հակառակը։
Մարդու մեկ բջջի մեջ առկա ԴՆԹ-ն կազմված է մոտ 3 միլիարդ A,T,G,C տարրերից😮: Որպեսզի լավ պատկերացնեք այդ թիվը բերենք մեկ համեմատություն։ Եթե մարդու մեկ բջջում առկա բոլոր ԴՆԹ մոլեկուլները ձգենք երկարությամբ և միացնենք իրար, կստացվի մոտ 1,5 մետր երկարությամբ մոլեկուլ։🙃Իսկ եթե նույն կերպ միացնենք բոլոր բջիջներում առկա ԴՆԹ-ներն իրար, ապա կստացվի ավելի քան 100 000 000 000 կմ, որը մոտավորապես հավասար է 150 000 անգամ թռիչքին դեպի Լուսին և հետ։ 🚀 Այժմ երևի ավելի լավ կպատկերացնեք, թե ինչքան լավ է փաթաթված ԴՆԹ-ն քրոմոսոմում։
Վերադառնանք մեր թեմային։ A,T,G,C տարրերի հաջորդականության մեջ կան այնպիսի հատվածներ, որոնք կոչվում են գեներ՝ կոդավորող հաստվածներ․ այդ չորս տառի կոմբինացիայից կոդավորում է սպիտակուց, որոնք մեր օրգանիզմի շարժիչ ուժն են։ Իրականում ԴՆԹ-ի շատ փոքր հատվածն է կոդավորում գենը՝ մոտ 1-2%-ը: Մնացյալ մասը չեն մասնակցում կոդավորմանն ու սպիտակուցների սինթեզին, բայց դա չի նշանակում, որ այդ տեղամասերն ոչ պիտանի և նշանակություն չունեցող մասեր են։ Դրանք նույնպես ունեն իրենց որոշակի ֆունկցիաները, օրինակ որոշ տեղամասեր հանդիսանում են ռեգուլատոր տեղամասեր։
Քրոմոսոմների ու ԴՆԹ-ի կառուցվածքի մասին ինֆորմացիան դեռ հայտնի էր շատ վաղուց, սակայն 90-ականներին մարդկանց հաջողվեց կարդալ ԴՆԹ-ի ամբողջ հաջորդականությունը։ Դա շատ հայտնի «Մարդու գենոմ» նախագիծն էր (1990-2003)։ Մարդու ամբողջական ԴՆԹ-ի հավաքակազմը կոչվում է գենոմ։ «Մարդու գենոմ» նախագծի շրջանակներում ապակոդավորված հաջորդականությունը կոչվեց մարդու ռեֆերենս գենոմ, որի հետ համեմատում են մնացած մարդկանց գենոմները։
Մինչև վերջերս տպագրվել են մարդու ռեֆերենս գենոմի թարմացված չորս տարբերակներ, որոնք ավելի ճշգրիտ տարբերակներ են։ Առաջին տարբերակներում թերությունը հիմնականում սարքավորումների մեջ էր, օրինակ եթե երկար կրկնվող հաջորդականություն լինի (ենթադրենք երկար A-երի հաջորդականություն), նախկինում դրա կոնկրետ երկարությունն ու տեղը դժվար էր որոշել։ Ներկայումս մանդու գենոմը սեկվենավորում են մի քանի ժամում և արժենում է մոտավորպես $600։
Գենետիկական վարիանտներ կամ մարդու գենի փոփոխություններ
Վերադառնանք մեր արտաքին տարբերություններին։
Մենք բոլորս տարբեր ենք, որի պատճառը մեր գենոմների որոշակի տարբերություններն են։ Սակայն իրականում այդ փոփոխությունները շատ փոքր մասն են կազմում․ եթե վերցնենք պատահական պոպուլյացիայից երկու մարդ, փոփոխությունը կազմելու է մոտ 0,1 %, որն էլ պայմանավորում է մեր արտաքին տեսքը: 99.9%-ով մեր գենոմը իդենտիկ է։
Մարդու գենոմի որոշակի փոփոխություններ կարող են նաև հակում առաջացնել որևէ հիվանդության զարգացման նկատմամբ։ Մարդու գենոմի A,T,G,C տարրերի հաջորդականության փոփոխությունները բաժանվում են երկու տիպի․
- Պոլիմորֆիզմներ կամ գենետիկական վարիանտներ (եզակի նուկլեոտիդային պոլիմորֆիզմներ – ԵՆՊ / Single Nucleotide Polymorphism – SNPs): Այս փոփոխությունները հաճախ են հանդիպում պոպուլյացիայում (>1%)
- Մուտացիաներ. հազվադեպ են հանդիպում պոպուլյացիայում։
Երկուսն էլ հաջորդականության մեջ որևէ տառի փոփոխությունն է այլ տառով: Տարբերությունը կայանում է նրանում, որ առաջինը հաճախակի է հանդիպվում, իսկ երկրորդը՝ ոչ։
Հիվանդությունները պայմանականորեն կարելի է բաժանել երկու խմբի՝ մոնոգեն և բազմագործոն։ Մեկ գենի փոփոխությամբ պայմանավորված հիվանդություններն անվանում են մոնոգեն հիվնադություններ, որոնց նկատմամբ հակումն առաջանում է մուտացիաների ժամանակ (սրանք պատկանում են ԴՆԹ-ի շղթայի փոփոխության երկրորդ տիպին՝ մուտացիաներին)։ Այս դեպքում կարող ենք ներկայացանել հստակ կապ․ մուտացիայի առաջացումը բերում է հիվանդության զարգաման։ Այս հիվանդությունները բավականին լավ ուսումնասիրված և հազվադեպ հանդիպվող հիվանդություններ են։
Բազմագործոն հիվանդությունների դեպքում ԴՆԹ-ի շղթայի պոլիմորֆիզմները (սրանք էլ առաջին տեսակին են պատկանում) առաջացնում են այդ հիվանդությունների զարգացման ռիսկ։ Այս պոլիմորֆիզմներն ի տարբերություն մուտացիաների ավելի հաճախ են հանդիպվում տարբեր պոպուլյացիաներում, սակայն դրանց առկայությունը չի հավաստում տվյալ մարդու մոտ այդ հիվանդության զարգացումը, այլ բարձրացնում է հիվանդության զարգացման ռիսկը։
Բազմագործոն հիվանդությունների դեպքում շատ մեծ դեր ունի շրջակա միջավայրն ու ապրելակերպը։ Օրինակ սրտանոթային հիվանդությունների դեպքում, եթե մարդն ունի հիվանդության զարգացման բարձր գենետիկական ռիսկ, ապա ոչ առողջ ապրելակերպը կարող է առաջացնել հիվանդության զարգացման բարձր հավանականություն։
Մեկ այլ օրինակ․ տիեզերական ճառագայթումը կարող է բարձրացնել մարդու վահանաձև գեղձի և կրծքագեղձի քաղցկեղի առաջացման հավանականությունը, եթե մարդն ունի այդ հիվանդություններին բնորոշ պոլիմորֆիզմներ։
Իսկ ինչպե՞ս գնահատել հիվանդության զարգացման ռիսկը։ Օգնության է հասնում Լայնագենոմային ասոցիացիաների հետազոտությունը (Genome-Wide Association Study – GWAS), որն իրենից ներկայացնում է հետևյալը․ ընտրում են նույն պոպուլյացիայից հավասար քանակությամբ որոշակի հիվանդությամբ հիվանդ և առողջ մարդիկ, կատարում են նրանց ամբողջական գենոմի վերլուծություն, համեմատում միմյանց հետ և հայտնաբերում գենետիկական վարիանտները՝ ասոցացված հիվանդության հետ։
Ներկայումս կա այնպիսի գրադարան (GWAS Catalog), որտեղ առկա են 519 421 գենետիկական վարինտների և հիվանդությունների/հատկանիշների ասոցիացիաներ։ Սակայն կա մի մեծ թերություն․ տարածաշրջանները հավասար չափով չեն հետազոտվել․ օրիանակ Եվրոպան ամենաշատն է ուսումնասիրվել, սակայն կան այպիսի տարածաշրջաններ, որոնք գրեթե չեն ուսումնասիրվել։
Բացի այդ, պարզվում է, որ պոլիմորֆիզմներն անհավասարաչափ են բաշխված, այսինքն որևէ տարածաշրջանում որոշակի հիվանդության հետ ասոցացվող պոլիմորֆիզմի հաճախականությունը հավասար չէ մեկ էլ տարածաշրջանում այդ նույն հիվանդության հետ ասոցացվող պոլիմորֆիզմի հաճախականությանը։ Հետևաբար, որևէ պոպուլյացիայի համար ստացած արդյունքները կիրառելի չեն մնացած պոպուլյացիաների համար։
Հետազոտություններ
Հետազոտության հեղինակն է կենսաինֆորմատիկ Մարիա Նիկողոսյանը։ Մարիան սովորել է Հայ-ռուսական համալսարանում՝ Կենսաինֆորմատիկա; Կենսաինժիներիա և մոլեկուլային կենսաբանություն բաժնում: Ուսման ժամանակ սկսել է իր հետազոտությունները Մոլեկուլային Կենսաբանության ինստիտուտում։ Այժմ Մարիան հետաղոտող է Մոլեկուլային Կենսաբանության Ինստիտուտումի Կենսաինֆորմատիկայի խմբում, ավագ հետազոտող է FAST ADVANCE հետազոտական նախագծում և ուսումնական ծրագրերի մենթոր՝ հետազոտող Հայաստանի կենսաինֆորմատիկայի ինստիտուտում, ինչպես նաև շուրջ 12 գիտական աշխատության հեղինակ է և պատրաստվում է թեկնածուական ատենախոսության պաշպանությանը։
Հետազոտության հիմանական խնդիրն է եղել
- ուսումնասիրել հիվանդությունների հետ ասոցացված SNP-ների բաշխվածությունը տարբեր պոպուլյացիաներում,
- գնահատել բազմագործոն հիվանդությունների առաջացման ռիսկը տարբեր պոպուլյացիաներում։
Հետազոտության ժամանակ առաջին քայլով վերցրել են հիվանդությունների հետ ասոցացված SNP-ների բաց տվյալներ։ Վերցված յուրաքանչյուր պոլիմորֆիզմ ունի
- իր ID համարը,
- գենոտիպը (այսինքն որ տառը որով է փոխարինվում),
- քրոմոսոմը (որ քրոմոսոմում է գտնվում),
- դիրքը (քրոմոսոմի կոնկրետ ո՛ր դիրքում է գտնվում),
- հիվանդությունը (որ հիվանդության հետ է ասոցացվում)
- և էֆեկտը (ինչքանով է մեծացնում հիվանդության զարգացման ռիսկը)։
Երկրորդ քայլով վերցրել են տարբեր պոպուլյացիաներից մարդկանց գենոմի ամողջական վերլուծություններ, որտեղ ներառել են նաև 99 հայեր։
Ընդհանուր ստացվել են 44 234 SNP-ներ և 1 039 մարդու գենոմի վերլուծություններ։
Բոլոր SNP-ների համար դասակարգել են գենոտիպերը, այսինքն յուրաքանչյուր անհատի (օրինակի) մոտ տվյալ SNP-ին բնորոշ քանի փոփոխություն է եղել։ Եվ քանի որ տվյալները անհամամատ շատ են, այդ տվյալներով աշխատելու համար մշակել են ալգորիթմ՝ ինքնակազմակերպվող քարտեզներ self-organizing map (SOM), որը չվերահսկվող մեքենայական ուսուցման ալգորիթմ է և իրականացնում է կլաստերիզացիա ու տվյալների չափողականության փոքրացում։
Նման ալգորիթմներով աշխատելու համար տվյալների բազան տառերից պետք է ձևափոխել թվերի։ Այդ անցումն արվել է հետևյալ տրամաբանությամբ․ այն գենոմի օրինակները, որտեղ տվյալ SNP-ին բնորոշ ոչ մի փոփոխություն չի եղել, նշանակվել են 0 թվով, որոնցում երկուսից մեկն է փոխվել՝ 1-ով, որոնցում երկուսն էլ փոխվել են` 2-ով (տես նկարը)։
Հաջորդ քայլով կատարվում է տվյալների կլաստերիզացիա և չափողականության փոքրացում։ Ինչ է դա իրենից ներկայացնում։ Տվյալների թվայնացումից հետո այն SNP-ները, որոնց համար այդ թվերի ստացված հաջորդականությունը նույնն է կամ շատ նման, հավաքվում են նույն վանդակի մեջ, այսինքն արդյունքում ինչքան մոտ են վանդակները, այդքան ավելի քիչ են տարբերվում դրանց համպատասխան թվային հաջորդականությունները։
Եվ վիզուալ ավելի լավ տեսանելի լինելու համար այն վանդակները, որոնցում տվյալ SNP-ին համապատասխան հիվանդության զարգացման ռիստը մեծ է (թվերը մեծ են), ներկում են կարմիր գույնով, որոնցում փոքր՝ կանաչ, իսկ որոնցում բացակայում են՝ կապույտ։
Արդյունքում ստացվում է այսպիսի գեղեցիկ պատկեր։
Նման պատկերներ ստացել են անհատների, աշխարհագրական շրջանների համար, իսկ վերջում նաև գլոբալ պատկեր։
Այդ բոլոր տվյալները հավաքագրել և ստեղծել են քարտեզ։ Յուրաքանչյուր տարածաշրջան ունի իրեն բնորոշ պատկերը, սակայն նկատվել է, որ Հայաստանը, Եվրոպան և Մերձավոր Արևելքը ունեն բավականին նման պատկերներ։
Հետազոտության շրջանականերում նաև վերլուծել են, թե ստացված գլոբալ պատկերում կարմիր հատվածները կոնկրետ ո՛ր հիվանդությունների հետ են ասոցացվում։
Նաև առանձնացրել են, թե ո՛ր աշխարամասերին, ո՛ր հիվանդություններն են տիպիկ, և ո՛ր հիվանդություններն են հադիպվում գրեթե բոլոր աշխարհամասերում։ Հայերի մոտ հաճախ հանդիպվում են այն SNP-ները, որոնք կապված են կրծքագեղձի քաղցկեղի, հիպերտոնիայի, ենթաստամոքսային գեղձի քաղցկեղի, ռևմատոիդ արթրիտի և մի շարք այլ հիվանդությունների հետ։
Ամփոփում
Հետազոտության արդյունքները ամփոփվել են հետևյալ կարևորագույն կետերով․
- Գենետիկական ռիսկ հանդիսացող SNP-երի բաշխումը կտրուկ տարբերվում է կախված պոպուլյացիայից,
- Կարիք կա GWAS ուսումնասիրությունների մեջ նեռառել բազմազան պոպուլյացիաներ,
- SNP-երի շատ տարածվածությունը, պարտադիր չի նշանակում այդ հիվանդությունների բարձր հաճախականություն։
Հ․Գ Հայու գեն ասվածը գոյություն չունի ))
Սեմինարների շարքն անցկացվում է SpaceShop42-ի կողմից իրականացվող «Յուվենիս» Գիտության հանրայնացման և հաղորդակցման ծրագրի շրջանակներում՝ Երիտասարդ գիտնականների աջակցության ծրագիր(ԵԳԱԾ)-ի ֆինանսավորմամբ։