%38تخفیف

دانلود پروژه:ارائه یک راهکار جدید برای تعیین نقطه شکست درخت تصمیم با استفاده از الگوریتم جهش قورباغه

تعداد 62صفحه در فایل word

چکيده

در این پایان­نامه نقاط شکست درخت تصمیم با به­کارگیری الگوریتم جهش قورباغه تعیین می­گردد. درخت تصمیم یک ابزار داده­کاوی برای مدل­سازی و پیش­بینی برای داده­های بزرگ می­باشد. برای ساخت درخت تصمیم، الگوریتم­های مختلفی ارائه گردیده است. در این الگوریتم­ها با توجه به داده­های آموزشی ویژگی­های مهم تعیین می­شود و درخت تصمیم به گونه­ای ساخته می­شود که ویژگی­های مهم و با قابلیت جداپذیری بالا در گره­های بالاتر قرار گیرند. در تمام این روش­ها روی نقاط شکست، هیچ الگوریتم تحلیلی وجود ندارد و این نقاط توسط کاربر تنظیم می­شود.

در این تحقیق با کدگذاری مناسب، درخت تصمیم به صورت یک بردار به عنوان قورباغه در الگوریتم جهش قورباغه در نظرگرفته می­شود. سپس داده­های آموزشی از درخت تصمیم تولیدی عبور داده می‌شود. تعداد مواردی که درخت تصمیم دسته­بندی را صحیح انجام دهد به عنوان تابع ارزیابی قورباغه استفاده شده است. نتایج پیاده­سازی بر روی پایگاه­داده Iris نشان می­دهد این الگوریتم توانسته است درخت تصمیم را به گونه­ای طراحی کند که این درخت بتواند به صورت کامل داده­های آموزش را دسته‌بندی نماید. سپس این درخت روی داده­های تست اجرا شده و به نتیجه 98.6% دقت در دسته­بندی دست یافته است.

کلمات کلیدی : درخت تصمیم؛ الگوریتم جهش قورباغه؛ نقاط شکست.

فهرست مطالب

عنوان                                                                                                                               صفحه

فهرست شکل‌‌ها ‌ج

فهرست جدول ها ‌د

فصل اول : کلیات تحقیق……………………………………………………………………………………………………………………………..1

1-1-   پیشگفتار 2

1-2-   داده کاوی  2

1-2-1-     روش های داده کاوی.. 3

1-2-2-     دسته بندی   3………………………………………………………………………………………………………………………………..3

1-2-3-     یادگیری با نظارت… 6

1-2-4-     یادگیری بدون نظارت… 6

1-2-5-     درخت تصمیم.. 6

1-3-   تعریف پروژه 10

1-4-   ساختار پایان نامه. 11

فصل دوم : پیشینه تحقیق ………………………………………………………………………………………………………………………..12

2-1 معرفی معیارها 15

2-1-1      معیار Information gain  15

2-1-2      معیار Gain Ratio  16

2-1-3       معیار Gini Index  16

2-1-4      مقایسه معیارهای انتخاب ویژگی.. 17

2-2     الگوریتم های یادگیری درخت تصمیم.. 18

2-2-1 الگوریتم CHAID 18

2-2-2      الگوریتم CART 19

2-2-3 الگوریتم ID3 20

2-2-4 الگوریتم C4.5. 21

2-2-5 الگوریتم C5.0. 22

2-2-6 الگوریتم QUEST 22

2-2-7 الگوریتم CRUISE 23

2-3     ساختن درخت تصمیم.. 23

2-3-1 ساخت درخت تصمیم در روش هایID3 ,C4.5 , CART. 23

2-4 بررسی کاربردهای درخت تصمیم در تحقیقات پیشین.. 24

فصل سوم : روش پیشنهادی …………………………………………………………………………………………………………………….27

3-1     الگوریتم های تکاملی.. 27

3-1-1      الگوریتم جهش قورباغه. 27

3-2     روش پیشنهادی برای تعیین نقاط شکست درخت تصمیم.. 35

فصل چهارم : جمع­آوری و تحلیل داده …………………………………………………………………………………………………….40

4-1 روش تحقیق.. 41

فصل پنجم : نتیجه­گیری و پیشنهادات …………………………………………………………………………………………………….46

5-1     نتیجه گیری.. 47

5-2     پیشنهادات… 48

منابع ………………………………………………………………………………………………………………………………………………………….49

پیوست ………………………………………………………………………………………………………………………………………………………52

فهرست شکل‌‌ها

عنوان                                                                                                                               صفحه

شکل 1-1. فرایند ایجاد مدل……………………………………………………………………………………………………………………….5

شکل 1-2. استفاده از مدل در پیش­بینی…………………………………………………………………………………………………….6

شکل 1-3. نمونه­ای از یک درخت تصمیم………………………………………………………………………………………………….8

شکل 2-1. نمونه­ای از یک درخت تصمیم برای دسته­بندی…………………………………………………………………….14

شکل 3-1. جداسازی مجتمع­ها برای m=n=3…………………………………………………………………………………………28

شکل 3-2. نمایش تکامل هر مجتمع(مرحله اول)…………………………………………………………………………………..29

شکل 3-3. نمایش تکامل هر مجتمع(مرحله دوم)…………………………………………………………………………………..30

شکل 3-4. روندنمای جستجوی سراسری الگوریتم جهش قورباغه…………………………………………………………32

شکل 3-5. روندنمای جستجوی محلی الگوریتم جهش قورباغه…………………………………………………………….33

شکل 3-6. شمای کلی الگوریتم SLFA……………………………………………………………………………………………………..34

شکل 3-7. نمایش یک قورباغه………………………………………………………………………………………………………………….35

شکل 3-8. درخت تصمیم مربوط به قورباغه…………………………………………………………………………………………….36

شکل 3-9. درخت تصمیم مربوط به قورباغه اول……………………………………………………………………………………..37

شکل 3-10. درخت تصمیم مربوط به قورباغه دوم…………………………………………………………………………………..38

شکل 3-11. درخت تصمیم مربوط به قورباغه سوم………………………………………………………………………………….39

شکل 3-12. درخت تصمیم مربوط به قورباغه چهارم………………………………………………………………………………39

شکل 4-1. درخت تصمیم مربوط به داده­های افراد مراجعه کننده به کلینیک………………………………………43

شکل 4-2. درخت تصمیم شماره 1 با اجرای برنامه بر روی داده Iris…………………………………………………..44

شکل 4-3. درخت تصمیم شماره 2 با اجرای برنامه بر روی داده Iris…………………………………………………..44

شکل 4-4. روش 10-fold بر روی داده Iris …………………………………………………………………………………………….45

فهرست جدول­ها

عنوان                                                                                                                               صفحه

جدول 3-1. یک نمونه داده آموزشی…………………………………………………………………………………………………………37

جدول3-2. جمعیت اولیه برای نمونه آموزشی داده شده ……………………………………………………………………….37

جدول 3-3. ارزیابی قورباغه­ها……………………………………………………………………………………………………………………39

جدول 4-1. اطلاعات افراد در مراجعه به کلینیک درمانی………………………………………………………………………..42

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo