%38تخفیف

دانلود پروژه:تدوین شاخصها و داشبورد ارزیابی و پیشبینی پیشرفت تحصیلی دانشجویان با شبکهعصبی و درختتصمیمC5

تعداد 118 صفحه در فایل word

چکیده

درک عواملی که منجر به موفقیت یا شکست در امتحانات مسئله ای جالب و چالش برانگیز است.مفاهیم مرتبط، تجزیه و تحلیل عوامل موفقیت در امتحانات، ممکن است به درک و به طور بالقوه به بهبود پیشرفت تحصیلی کمک کند.بنابراین در این پژوهش ضمن مروری کلی بر داده کاوی و ویژگی های اصلی یک داشبورد مدیریتی کارا، سعی بر این است تا یک مطالعه موردی بر روی پایگاه داده های دانشگاه های سراسری و آزاد استان قم صورت گیرد تا پیشرفت تحصیلی دانشجویان پیش بینی گردد.

در این پژوهش ابتدا توسط الگوریتم k-means خوشه بندی صورت گرفته است و با استفاده از شاخص ارزیابی SSE ، تعداد خوشه بهینه تعیین گردیده است. بنابراین تعداد خوشه بهینه برای دانشجویان چهار خوشه می باشد و سپس خوشه ها با روش های پیش بینی داده کاوی از جمله شبکه عصبی و درخت تصمیم C5 که از پرکاربردترین و دقیق ترین روش های پیش بینی می باشند، پیش بینی شده اند و درنهایت با استفاده از نتایج این روش ها، شاخص های مناسب یافت شدند و به صورتی روشن در یک داشبورد نمایش داده شدند.

فهرست مطالب

فصل اول:. 1

1-1-مقدمه. 2

1-2-تعریف مساله و بیان سوال های اصلی تحقیق. 3

1-3-ضرورت انجام تحقیق. 6

1-4-هدف‌ها و کاربردهای مورد انتظار از انجام تحقیق   7

1-5-جنبه جدید بودن و نوآوری طرح. 7

1-6-قلمرو مکانی و زمانی تحقیق. 8

1-7-روش تجزیه و تحلیل داده‌ها. 8

1-8-ساختار تحقیق. 8

1-9-تعاریف و اصطلاحات. 9

1-10-نتیجه گیری. 12

فصل دوم:. 122

2-1- مقدمه. 133

2-2-انگیزه‌های کاوش داده. 13

2-3-نیاز به داده‌کاوی. 15

2-4- چالش‌های داده‌کاوی. 16

2-4-1- چالش‌های اولیه. 17

2-4-2- چالش‌های ثانویه. 18

2-5-معرفی داده‌کاوی. 19

2-5-1-منشاُ علمی. 21

2-5-2- معماری سیستم داده‌کاوی. 21

2-5-3- مراحل عملیات داده‌کاوی. 23

2-5-3-1-آماده‌سازی داده. 23

2-5-3-2-یادگیری مدل. 24

2-5-3-3-ارزیابی و تفسیر مدل. 25

2-6- محدودیت‌های داده‌کاوی. 25

2-7- قابلیت‌های داده‌کاوی. 26

2-8- روش‌های یادگیری مدل در داده‌کاوی. 26

2-8-1- روش‌های پیش‌بینی. 26

2-8-1-1- دسته‌بندی. 27

2-8-1-2- رگرسیون. 27

2-8-1-3-تشخیص انحراف. 28

2-8-2- روش‌های توصیفی. 29

2-8-2-1- خوشه‌بندی. 30

2-8-2-2- کشف قوانین انجمنی. 32

2-8-2-3- کشف الگوهای ترتیبی. 32

2-9- فنون داده‌کاوی. 32

2-9-1- یافتن خودکارخوشه‌ها. 34

2-9-1-1-نقاط قدرت این روش. 34

2-9-1-2-نقاط ضعف. 34

2-9-1-3- کاربرد. 34

2-9-2- درخت‌های تصمیم‌گیری و استقرا قاعده‌ای. 35

2-9-2-1-نقاط قوت. 35

2-9-2-2-نقاط ضعف روش درخت‌تصمیم‌گیری. 35

2-9-2-3-کاربرد. 36

2-9-3- شبکه‌های عصبی. 36

2-9-3-1- نقاط قوت شبکه‌های عصبی مصنوعی. 36

2-9-3-2- نقاط ضعف شبکه‌عصبی. 37

2-9-3-3-کاربرد. 37

2-10- درجه‌بندی فنون مختلف داده‌کاوی از جهت سختی و آسانی   37

2-11-تعریف داشبورد. 38

2-12- سابقه تحقیق. 43

2-12-1- سابقه داده‌کاوی. 43

2-12-2- سابقه داشبورد. 47

2-13 بررسی مراحل داشبورد در چند نمونه. 49

2-14-نتیجه گیری. 50

فصل سوم:. 51

3-1- مقدمه. 52

3-2- چارچوب تحقیق. 53

3-3- روش تحقیق. 54

3-3-1- طبقه‌بندی تحقیق برمبنای هدف. 54

3-3-2- طبقه بندی تحقیق بر مبنای روش. 54

3-3-3- طبقه‌بندی تحقیق بر مبنای نوع داده‌ها. 55

3-4- جامعه آماری. 55

3-5- نمونه‌گیری. 56

3-5-1- روش نمونه‌گیری. 56

3-6- روش ها و ابزار گردآوری و تحلیل داده‌ها. 56

3-7- ساختار اجرایی تحقیق. 57

3-7-1- ساختار اجرایی بخش اول تحقیق. 58

3-7-1-1- درک مساله. 59

3-7-1-2- شناخت داده‌ها. 60

3-7-1-3- آماده سازی داده‌ها. 61

3-7-1-4- مدل‌سازی. 61

3-7-1-5- ارزیابی نتایج. 62

3-7-1-6- بکارگیری مدل. 62

3-8- تحلیل خوشه‌ای. 63

3-9- الگوریتم  k-means. 64

3-10-شبکه‌عصبی. 65

3-10-1- معماری شبکه. 66

3-11-درخت‌تصمیم. 67

3-12- شاخص مقایسه نتایج خوشه‌بندی با رویکردهای مختلف   69

3-12-1- شاخص مجموع خطای مربعی. 69

3-13- ابزار‌های داده‌کاوی. 69

3-14- بخش دوم ساختار اجرایی تحقیق. 70

3-14-1- شناسایی شاخص. 70

3-14-2- پیاده‌سازی داشبورد. 70

3-15- ابزار پیاده‌سازی داشبورد. 71

3-16- نتیجه‌گیری. 71

فصل چهارم:. 73

4-1-مقدمه. 74

4-2-فرآیند داده‌کاوی. 74

4-2-1-درک مساله. 74

4-2-2-شناخت داده‌ها. 75

4-2-2-1- داده‌ها. 75

4-2-2-2- انتخاب داده‌ها. 75

4-2-3- آماده سازی و پیش پردازش داده‌ها. 76

4-2-3-1- آماده سازی داده‌ها. 76

4-2-3-2-پیش پردازش داده‌ها. 77

4-2-4-مدل‌سازی. 82

4-2-4-1-خوشه‌بندی. 83

4-2-4-2- خوشه‌بندی k-means. 83

4-2-4-3- پیش‌بینی خوشه‌ها. 84

4-2-4-4- پیش‌بینی با شبکه‌عصبی. 85

4-2-4-5- پیش‌بینی با درخت‌تصمیم C5. 85

4-2-5- ارزیابی. 88

4-2-6- به‌کارگیری مدل. 89

4-3- فرآیند طراحی و پیاده‌سازی داشبورد. 89

4-3-1- شناسایی شاخص. 89

4-4- نتیجه‌گیری. 93

فصل پنجم:. 94

5-1- مقدمه. 95

5-2- مروری برفصل‌های گذشته. 95

5-3- دستاوردها و نوآوری‌های تحقیق. 96

5-4- پیشنهادات برای تحقیق‌های آتی. 97

5-5- محدودیت‌های تحقیق. 98

فهرست منابع. 99

 

 

 

 

 

 

فهرست جداول

جدول2-1 درجه‌بندی فنون مختلف داده‌کاوی. 38

جدول 2-2 تعاریف داشبورد در مرور ادبیات. 38

جدول 2-3 مراحل طراحی داشبورد. 49

جدول3-1 الگوریتم خوشه‌بندی. 65

جدول 4-1 اقلام اطلاعات فردی دانشجویان. 78

جدول 4-2 اقلام اطلاعاتی معدل دانشجویان. 79

جدول 4-3 اقلام اطلاعاتی دانشگاهی دانشجویان. 79

جدول 4-4 نرخ پارامتر SSE به ازای تعداد خوشه‌ها در k-means  84

جدول 4-5 پیش بینی با استفاده از روش شبکه‌عصبی. 85

جدول 4-6 دسته‌بندی معدل‌‌ها. 86

جدول 4-7 پیش بینی با استفاده از روش درخت تصمیمC5. 87

جدول 5-1 دقت پیش‌بینی‌های انجام شده. 97

فهرست شکل‌ها و نمودارها

شکل 1-1-ساختار تحقیق. 9

شکل2-1: قیاس رشد حجم داده با رشد تعداد تحلیل‌گران داده   15

شکل 2-2 سلسله مراتب داده تا خرد. 20

شکل 2-3 معماری یک سیستم داده‌کاوی. 22

شکل 2-4 ساختار داده‌کاوی آموزشی. 44

شکل 3-1 مراحل اصلی پیشنهادی برای اجرای تحقیق. 53

شکل 3-2  استاندارد جهانی CRISP. 59

شکل 4-1 بخشی از ارتباط داده‌ای جداول. 77

نمودار 4-1 میزان استفاده تکنیک‌های پیش‌پردازش داده. 81

شکل 4-2بخشی از داده‌ها در نرم‌افزار Excel 82

شکل 4-3 تعداد رکوردها در هر خوشه. 84

شکل 4-5 اهمیت فیلدها در پیش‌بینی معدل ترم شش دانشجویان   88

شکل4-6 پیشرفت تحصیلی دانشجویان ورودی سال 1371. 91

شکل4-7 پیشرفت تحصیلی دانشجویان ورودی سال 1381. 91

شکل 4-8 پیش بینی پیشرفت تحصیلی دانشجویان فاقد شغل ورودی سال 1381   92

شکل 4-9 پیش‌بینی پیشرفت تحصیلی دانشجویان شاغل در سازمان‌های دولتی ورودی سال 1381. 93

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo