%36تخفیف

دانلود پروژه: ارزیابی سیستم های دسته بند یادگیر برای تعیین استراتژی بهینه در بازی‌های رقابتی

تعداد 106صفحه در فایل word

کارشناسی ارشد(M.SC)

گرايش نرم افزار

ارزیابی سیستم های دسته بند یادگیر برای تعیین استراتژی بهینه در بازی‌های رقابتی

چکیده

نقش یادگیری در همه صحنه‌های زندگی نمایان است. یادگیری عبارت است از به دست آوردن دانش و یا فهم آن از طریق مطالعه، تجربه یا آموزش. یادگیری ماشین به عنوان یکی از شاخه‌های وسیع و پرکاربرد هوش مصنوعی به تنظیم و اکتشاف شیوه‌ها و الگوریتم‌های یادگیری می‌پردازد. انواع مختلفی از الگوریتم های یادگیری مانند یادگیری تقویتی، الگوریتم ژنتیک، الگوریتم مورچگان و سیستم های دسته بند یادگیر وجود دارد. سیستم های دسته بند یادگیر انواع قدرتمندی از تکنیک‌های یادگیری مبتنی بر قاعده هستند که بر پایه‌ی دو رهیافتِ یادگیری تقویتی و الگوریتم های تکاملی، بنا شده و می‌توانند برای دسته بندی وظایف استفاده شوند. این سیستم ها از سه مولفه اصلیِ بازنمایی دانش، یادگیری تقویتی و تکامل قوانین تشکیل شده است. بسته به تکنیک های متفاوتی که برای این سه مولفه تعریف می شود، سیستم های دسته‌بند یادگیرِ متفاوتی به وجود آمدند اما از دیدگاه کلی به دو خانواده بزرگ میشیگان و پیتسبرگ تقسیم می شوند. در این سیستم ها تعیین بهترین سبک در مسئله های مختلف، برای استفاده بهینه از آن ها، بسیار مهم و اساسی است. هر مسئله شرایط مختلفی دارد که استراتژی های متفاوتی را می‌طلبد. از رو در این پایان نامه، به ارزیابی عملکرد سه سبک مهمِ LCS از آقای هلند، ZCS وXCS از آقای ویلسون و نیز مقایسه آن ها برای تعیین بهترین سبک و بدست آوردن بهینه‌ترین استراتژی برای مسئله‌ میز است. نتایجی که از پیاده سازی و شبیه سازی این سه سبک در پنج محیطِ متفاوت از میز بدست آمده، نشان دهنده برتری XCS نسبت به ZCS و LCS دارد. در پیاده سازی رقابتی XCS و ZCS نیز XCS عملکرد بهتری را نشان داده است.

کلمات کلیدی: سیستم های دسته بند یادگیر، LCS، XCS، ZCS ، میز

فهرست مطالب

عنوان                                                                                                        صفحه

فصل اول : بیان مسئله.. 1

1-1 مقدمه.. 2

1-2 یادگیری.. 4

1-2-1 هدف از یادگیری.. 4

1-2-2 یادگیری ماشین.. 5

1-2-3 انواع روش های یادگیری.. 6

1-3 روش کار یادگیری تقویتی.. 8

1-3-1 خاصیت مارکوف.. 8

1-3-2 تابع ارزش.. 9

1-4 الگوریتم ژنتیک(GA) 10

1-4-1 ایده کلی.. 10

1-4-2 فضای فرضیه.. 10

1-4-3 ویژگی ها.. 11

1-4-4 عملگرهاي الگوریتم  ژنتيك.. 11

1-5 مسئله میز.. 13

فصل دوم : سوابق مربوطه.. 15

2-1 مقدمه.. 16

2-2 الگوریتم RL.. 16

2-3 الگوریتم GA.. 17

2-4 الگوریتم ACO.. 19

2-5 LCS. 22

2-5-1شبیه سازی نبرد هواپیماها.. 22

2-5-2 شبیه سازی فوتبال.. 23

2-5-3 مدیریت ترافیک.. 24

2-5-4 تحلیل سهام.. 25

فصل سوم : سیستم های دسته بند یادگیر.. 26

3-1 مقدمه.. 27

3-2 سبک میشیگان.. 29

3-3 سبک پیتسبورگ.. 33

3-4 سیستم های دسته بند.. 36

3-4-1 مقدمه.. 36

3-4-2 یک سیستم دسته بندی ساده.. 36

3-4-3 انتخاب دسته بندی.. 37

3-4-4 یک مثال سیستم دسته بندی – بازی کاراکتر.. 38

3-4-5 خود یادگیری در سیستم های دسته بند.. 38

3-4-6 الگوریتم روش پوشش.. 39

3-4-7  الگوریتم Bucket Brigade (مسئله تخصیص اعتبار).. 40

3-5 ایده اصلی سیستم های دسته بند یادگیر.. 40

3-5-1 تشریح عملکرد سیستم های دسته بند با یک مثال ساده   41

3-5-2 پیغام ها.. 42

3-5-3 شرط ها.. 43

3-5-4 عمل ها.. 45

3-5-5 دسته بندی کننده ها.. 46

3-5-6 سیستم های دسته بندی کننده یادگیر.. 47

3-6 ZCS. 49

3-6-1 مقدمه.. 49

3-6-2 شرح ZCS. 49

3-6-3 خلاصه ای از لیست پارامتر ها.. 53

3-7 XCS. 53

3-7-1 مولفه کارایی.. 57

3-7-2 مولفه تقویتی.. 57

3-7-3 مولفه اکتشاف.. 58

3-7-4 محاسبه تناسب.. 60

3-7-5 دسته بند ماکرو.. 60

3-7-6 لیست پارامتر ها.. 61

3-7-7  مدل هایی دیگر از ZCS و XCS. 61

3-8 بررسی و مقایسه برخی مدل های دیگر LCS. 63

فصل چهارم : طراحی سیستم دسته بند یادگیر برای مسئله میز.. 65

4-1 مقدمه.. 66

4-2 میز به عنوان مسئله رقابتی.. 66

4-3 دلیل استفاده از LCS. 67

4-4 فلوچارت LCS. 67

4-5 فلوچارت ZCS. 69

4-6 فلوچارت XCS. 70

4-7 مقایسه و جمع بندی فصل.. 71

فصل پنجم: شبیه سازی.. 72

5-1 مقدمه.. 73

5-2 نرم افزار نت لوگو.. 73

5-3 تفاوت شبیه سازی و مدل سازی.. 74

5-4 محیط های میز.. 75

5-5 نتایج به دست آمده از شبیه سازی LCS. 76

5-6 نتایج بدست آمده از شبیه سازی ZCS. 77

5-7 نتایج بدست آمده از شبیه سازی XCS. 79

5-8 نتایج بدست آمده از شبیه سازی XCS و ZCS به صورت رقابتی   80

5-9 مقایسه نتایج.. 81

فصل ششم : جمع بندی و کارهای آینده.. 85

6-1 جمع بندی.. 86

6-2 کارهای آینده.. 90

فصل هفتم : پیوست ها.. 92

1-7 کد شبیه سازی LCS. 93

منابع فارسی.. 93

منابع لاتین.. 94

فهرست جداول

عنوان                                             صفحه

جدول (3-1) : بازی کاراکتر پیاده سازی شده توسط سیستم دسته بند   38

جدول (3-2) : قواعد اگر – آنگاه برای قورباغه.. 42

جدول (3-3): قواعد if-then رمزگذاری شده با توجه به جدول (3-1)   46

جدول (3-4): برخی از محبوب ترین LCSها.. 63

جدول (5-1): مقایسه نتایج بدست آمده از LCS، ZCS و XCS در محیط اول.. 82

جدول (5-2): مقایسه نتایج بدست آمده از LCS، ZCS و XCS در محیط دوم.. 82

جدول (5-3): مقایسه نتایج بدست آمده از LCS، ZCS و XCS در محیط سوم.. 82

جدول (5-4): مقایسه نتایج بدست آمده از LCS، ZCS و XCS در محیط چهارم.. 83

جدول (5-5): مقایسه نتایج بدست آمده از LCS، ZCS و XCS در محیط پنجم.. 83

جدول (5-6): مقایسه نتایج بدست آمده از LCS، ZCS و XCS در محیط پنجم.. 83

فهرست شکل ها

عنوان                                                                    صفحه

شکل 1-1 : ساختار سیستم های دسته بند یادگیر.. 3

شکل1-2: شماتیکی از یادگیری تقویتی.. 7

شکل 1-3 : برش در الگوریتم ژنتیک.. 12

شکل 1-4 : جهش در الگوریتم ژنتیک.. 13

شکل 1-5 : نمونه زمین بازی میز.. 14

شکل 1-6 : رمزگذاری دسته بندی کننده ها برای مسئله هدایت عامل در این مسئله.. 14

شکل 2-1 : انتخاب کوتاه ترین مسیر توسط الگوریتم مورچگان.. 20

شکل 2-2 : قرار گیری مانع بر سر الگوریتم مورچگان.. 21

شکل 2-3 : شبیه سازی نبرد هواپیما.. 23

شکل 2-4 : شبیه سازی فوتبال.. 24

شکل 3-1 : سلسکه مراتب شکل گیری LCS. 27

شکل 3-2 : LCS توزیع شده.. 29

شکل 3-3 یک معماری عمومی برجسته از سبک میشیگان.. 30

شکل 3-4 یک معماری عمومی‌ برجسته از سبک پیتسبورگ.. 33

شکل 3-5: مقایسه میشیگان و پیتسبورگ.. 34

شکل 3-6 : سیستم دسته بند.. 36

شکل 3-7: انتخاب دسته بندی در سیستم دسته بند.. 37

شکل 3-8 : روش پوشش در سیستم دسته بند.. 39

شکل 3-9: ساختار LCS. 41

شکل3-10: یک نوع رمزگذاری برای دسته بندی کننده قورباغه.. 43

شکل 3-11: تابع S ← matchesConditions(M, C) 44

شکل 3-12: سیستم دسته بند یادگیر.. 48

شکل 3-13 شماتیکی از ZCS. 50

شکل 3-14: شماتیکی از XCS. 56

شکل 3-15: شماتیکی از ZCS. 62

شکل 3-16: شماتیکی از XCS. 62

شکل 4-1: فلوچارت LCS. 68

شکل 4-2: فلوچارت ZCS. 69

شکل 4-3 فلوچارت XCS. 70

شکل 5-1: تصویری از محیط نت لوگو.. 74

شکل 5-2: محیط اول میز.. 75

شکل 5-3: محیط دوم میز.. 75

شکل 5-4: محیط سوم میز.. 75

شکل 5-5: محیط چهارم میز.. 75

شکل 5-6: محیط پنجم میز.. 76

شکل 5-7: نتایج LCS در محیط اول.. 76

شکل 5-8: نتایج LCS در محیط دوم.. 76

شکل 5-9: نتایج LCS در محیط سوم.. 77

شکل 5-10: نتایج LCS در محیط چهارم.. 77

شکل 5-11: نتایج LCS در محیط پنجم.. 77

شکل 5-12: نتایج ZCS در محیط اول.. 78

شکل 5-13: نتایج ZCS در محیط دوم.. 78

شکل 5-14: نتایج ZCS در محیط سوم.. 78

شکل 5-15: نتایج ZCS در محیط چهارم.. 78

شکل 5-16: نتایج ZCS در محیط پنجم.. 78

شکل 5-17: نتایج XCS در محیط اول.. 79

شکل 5-18: نتایج XCS در محیط دوم.. 79

شکل 5-19: نتایج XCS در محیط سوم.. 79

شکل 5-20: نتایج XCS در محیط چهارم.. 79

شکل 5-21: نتایج XCS در محیط پنجم.. 80

شکل 5-22: نتایج رقابت XCS و ZCS در محیط اول.. 80

شکل 5-23: نتایج رقابت XCS و ZCS در محیط دوم.. 80

شکل 5-24: نتایج رقابت XCS و ZCS در محیط سوم.. 81

شکل 5-25: نتایج رقابت XCS و ZCS در محیط چهارم.. 81

شکل 5-26: نتایج رقابت XCS و ZCS در محیط پنجم.. 81

شکل 6-1: معماری OCS. 91

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo