%46تخفیف

مقایسه رگرسیون های لاسو و ریج در شناسایی چندشکلی های تک نوکلئوتیدی مرتبط با صفات کمی

 

بخش علوم دامی

کارشناسي ارشد رشته مهندسي علوم دامیژنتیک و اصلاح نژاد

مقایسه رگرسیون های لاسو و ریج در شناسایی چندشکلی های تک نوکلئوتیدی مرتبط با صفات کمی

چکیده:

مطالعاتارتباطیکلژنوم(GWAS)،بابهرهگیریازنشانگرهایتکنوکلئوتیدی (SNP) متراکم مسیرنوینیرابرایکشفژنها­­ی مرتبطباصفاتکمی و دارای مکانیسم توارثی پیچیده­،فرا رویمحققانقراردادهاند. حجمبالایSNP ها(پیشبینها) ازیکسووهمبستگیآنهاباهمازسوییدیگر، فراینداستخراج وآنالیزاینگنجینه یفوقالعادهحجیم را  باچالشمواجه ساختهاست. درمطالعاتGWAS،علیرغمتراکمبالایSNP ها معمولا فقطتعدادیازآنهارویصفتموردنظر اثرقابلتوجهیدارند. روشهایانقباضی، کهاخیراتوجهزیادیرابهخودجلبکردهاند،مشکل بزرگتر بودن بردار پارامترها نسبت به بردار مشاهدات (p>>n) وهمبستگیبینمتغرهای پیش بینی کننده را با اعمالجریمهرویمدل،تخفیفداده وضرایبرگرسیونیرابااعمالمحدودیترویدامنهتغییراتآنهابرآوردمیکنند. هدفازاینمطالعهارزیابیومقایسهیدوروش رگرسیون همراهباجریمهی ریج ولاسودرشناساییچندشکلیهایمرتبطبا صفاتکمی بود. ایندو مدلرگرسیونی،رویدادههایGWAS  مربوطبهصفاتکمیموش ( تعداد 42428پیشبینی کنندهیا SNP روی تعداد 288 فرد)  بااستفادهازنرمافزارمحاسباتیR اجراوعملکرددومدلمقایسهشد. دراینمطالعه،ضرایب مدل برآوردومعیاراعتبارسنجیبرایهردومدلدرهشتصفتمتابولیکیمحاسبهومقایسهشد. مقایسهیاعتبارسنجیدومدل برایهرهشتصفت،نشانگربرازشبهتر رگرسیون ریجنسبتبهرگرسیون لاسوبود.

واژه های کلیدی: مطالعات ارتباطی کل ژنوم، جریمه، روش های انقباضی، رگرسیون ریج،  لاسو، اعتبارسنجی متقابل

فصلاول. أ‌

1-1: مقدمه. 2

1-2:تعریفمسئله. 2

1-3: اهدافتحقیق. 2

1-4:ضرورتجدیدبودنونوآوریطرح. 3

فصلدوم. 4

مروریبرپژوهشهایپیشین. 5

2-1:چندشکلیتکنوکلوتیدی. 5

2-2: مطالعاتارتباطیکلژنوم. 5

2-2-1:ازپیوستگیتاارتباط. 6

2-3:چالشهایآماریدرقلمرومطالعاتGWAS. 7

2-3-1:حجمبالایدادهها (P>>N) 8

2-3-2:همخطیچندگانه (وجودارتباطبینSNPها( 8

2-4:مدیریتچالشها. 9

2-4-1: انتخابمتغیر. 9

2-4-2: تابعتاوان. 10

2-5:روشهایانقباضی. 11

2-5-1: دادوستدواریانس-اریبی. 11

2-5-2: رگرسیونریج (مرزی). 12

2-5-2-1:هندسه‌یریج. 13

شکل 2-1.عملکردروشرگرسیونریج، (ماخذ:تیبشیرانی 1996). 14

2-6: پارامترکنترلیاتنظیم. 14

2-7: انتخابلاندا. 14

2-8:رگرسیونلاسو: عملگرانتخابوحداقلمطلقانقباض. 15

2-8-1:هندسه‌یلاسو. 15

شکل2 -2.عملکردروشلاسو، (ماخذ:تیبشیرانی 1996). 16

2-9: اعتبارسنجیمتقابل. 16

2-10: تفاوتهایدومدلریجولاسو. 17

2-11: نرمافزارRبرایمطالعاتارتباطیکلژنوم. 17

2-12: کارهایپیشین. 17

2-12-1: حاشیه‌ایبرمنابعژنتیکیموش. 18

فصلسوم. 20

3: موادوروشها. 21

3-1:دادهها. 21

3-2:ژنوتایپینگودادههایژنوتیپی. 22

3-3: دادههایفنوتیپیوفنوتایپینگ. 22

3-3-1: اندازهگیریصفاتخونی(SBP,DBP,MAP ). 22

3-3-2:اندازه‌گیریغلظتآلبومینبهکراتینادرار. 23

3-3-3: اندازه‌گیریصفاتمتابولیکیچربیوقند. 23

3-4:نرمافزاروبسته‌هایموردنیاز. 24

3-6:مجموعه‌یآموزشدرمقابلمجموعهیآزمون. 25

3-6:اعتبارسنجیمتقابل. 26

فصلچهارم. 28

نتایج…………………………………… 29

4-1:انتخابمتغیر. 29

جدول4-1.خلاصهضرایبرگرسیون‌هایبراوردشدهبرایمتغیرپاسخSBP. 29

جدول4-2. خلاصهضرایبرگرسیون‌هایبراوردشدهبرایمتغیرپاسخHDL  30

4-1-1چندشکلی‌هایتکنوکلئوتیدیمنتخبباروشلاسو. 30

4-2 :گامهیپیشبینیوبرآورد. 31

4-2-1: لاندا (پارامترتنظیم). 31

4-2-2: اعتبارسنجیمتقابل. 32

4-2-3:میانگینمربعاتخطا. 35

4-3:ارزیابیکاراییمدللاسووریج. 36

4-3-1: ریشه‌یمیانگینمربعاتخطا. 36

4-4:  محدودیت‌هایلاسودرحوزه‌یمطالعاتارتباطی. 37

4-5: نتیجه‌گیریکلی. 38

4-6:پیشنهادات. 38

4-7:سپاسگزاری. 38

منابع. 39

پیوست. 45

فهرست عبارات و علایم اختصاری

GWASGenome-wide association studies

 SNP                                                   Single nucleotide polymorphism

QTL                                                   Quantitative trait locus

LD                                                      Linkage disequilibrium

LASSO                                                         Least Absolute Shrinkage and Selection Operator

CV                                                                cross-validation

GLMNET                                                     Generalized linear models with convex penalties

NMRI                                                            Naval Medical Research Institute

SBP                systolic blood pressure

DBPdiastolic blood pressure

MAP mean arterial pressure

HDLhigh-density lipoprotein cholesterol

CHLtotal cholesterol

ACRurinary albumin-to-creatinine ratio

TGtriglycerides

GLU  glucose

λ                                                                    tunning parameter

فهرست جداول و نمودارها

جدول3-1 ساختارفنوتیپیداده­ها.. 24

جدول 4-1. خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخSBP  29

جدول 4-2. خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخHDL   30

جدول4-3. تعدادSNPهایمنتخببالاسودرصفاتکمیبهتفکیککروموزومی.   30

جدول 4-4. مشخصات دو جایگاه معنی داری روی صفت کلسترول در مطالعات زانگ و همکاران.. 31

جدول 4-5.اعتبارسنجیمحاسبهشدهبرایدومدلانقباضی.. 32

جدول4-6 . ریشه­یمیانگینمربعاتخطابرایدومدللاسووریج.. 43

جدول 6-1: خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخDBP  62

جدول 6-2: خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخMAP  62

جدول 6-3 : خلاصهضرایبرگرسیون‌هایبراوردشدهبرایمتغیرپاسخACR   62

جدول 6-4:خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخCHL   63

جدول6-5: خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخTRI  63

جدول 6-6 : خلاصهضرایبرگرسیون‌هایبرآوردشدهبرایمتغیرپاسخGLU   63

فهرست اشکال

شکل 2-1.عملکردروشرگرسیونریج، (ماخذ:تیبشیرانی 1996).. 14

شکل2-2.عملکردروشلاسو، (ماخذ:تیبشیرانی 1996).. 16

شکل 2-3. CCلاینهمخوننوترکیببهعنوانمنبعجمعیتژنتیکی.. 19

شکل 3-4. کدایجادمجموعهآموزشوآزمایشکهمتغیرپاسخآنمتغیرSBPاست.   26

شکل 4-1. اثرنرخلاندادرمدل.. 32

شکل 4-2. مدلهایریجولاسومربوطبهمتغیرپاسخفشارخونسیستولیک.   34

شکل 4-3. نموداراعتبارسنجیمتقابلبرایصفتفشارخونسیستولیک   35

شکل 6-1.نمودارهایصفتDBP. 64

شکل 6-2. نمودارهایصفتMAP. 64

شکل6-3. نمودارهایصفتACR.. 65

شکل 6-4. نمودارهایمربوطبهصفتCHL.. 65

شکل 6-5. نمودارهایمربوطبهصفتTRI. 66

شکل6-6. نمودارهایمربوطبهصفتGLU.. 66

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo