%36تخفیف

دانلود پروژه: مدلسازی تخلفات رانندگان در شهرکرمان با بهره­گیری از الگوریتم­های داده­کاوی  

تعداد 142صفحه در فایل word

کارشناسی ارشد رشته مهندسی کامپیوتر (M. Sc.)

گرایش نرم‌افزار

مدلسازی تخلفات رانندگان در شهرکرمان با بهره­گیری از الگوریتم­های داده­کاوی

 

چکیده

 آمارها نشان مي­هد كه كشور ایران از لحاظ بروز تخلفات رانندگي و تصادفات نسبت به كشورهاي جهان، سهم بيشتري را به خود اختصاص داده است. طبق آخرین آماری که توسط کارشناسان امر ترافیک به­دست­آمده سالانه حدود سه درصد از تولید ناخالص ملی کشورمان صرف آثار و تبعات ناشی از تخلفات ترافیکی و تصادفات می­شود. عامل انسانی یکی از اصلی­ترین عامل­های بروز تخلفات است، اما می­تواند عاملی موثر در جهت جلوگیری و تعدیل حوادث ترافیکی باشد. لذا ضمن بررسی علل و انگیزه­های بروز تخلفات، می­توان  با تکنیک­های داده­کاوی اقدام به کنترل عامل انسانی، شناسایی رانندگان متخلف خطرآفرین و جلوگیری از تخلفات احتمالی آنان در آینده نمود. داده­کاوی در خصوص ترافیک و موضوعات مرتبط با آن و مرور مبانی و چارچوب نظری در زمینه مدیریت ترافیک شناخت کاملی از ابعاد آن ارائه و درک جنبه­های مختلف تحقیق را آسان می­کند. امروزه در شهر کرمان و هم­چنین در سایر شهرهای بزرگ کشور، مشکلات ترافیکی نمود فراوانی پیدا کرده و باعث نارضایتی مردم شده است به طوری­که باعث بروز برخی ناهنجاری­ها و قانون شکنی­ها از طرف شهروندان شده است. مدل رفتار رانندگان تحت تاثیر عواملی مانند: ویژگی­های فرهنگی هر شهر، بافت شهری از منظر شهرسازی، گروه سنی رانندگان، عوامل جغرافیایی، اقتصادی و محیطی است که میزان و نوع آن متفاوت خواهد بود، بنابراین نتیجه تحقیقات هر منطقه، شهر یا کشور نمی تواند به طور 100 % در شهرهای دیگر نیز صادق باشد. اين تحقیق با کاربرد عملي داده­کاوي در داد­ه­هاي تخلفات ترافيکي بررسي نموده است که شناسايي رانندگان متخلف خطرآفرین چگونه انجام شده و آيا مي­توان با دانستن سوابق تخلفاتي و ویژگی­هاي فردي و محيطي، آنان را شناسايي و قوانين لازم را براي کاهش تخلفات ترافیکی تدوين و اجرا نمود. تکنیک­های داده­کاوی در جهت دستیابی به قوانین تصمیم­گیری و مدل شناسایی رانندگان خطرآفرین در تخلفات استفاده شده است. دراجراي روش تکنیک­های دسته­بندي در داده­کاوي از الگوریتم­های مختلف دسته­بندی و سپس از رویکرد ترکیبی متشکل از تکنیک خوشه­بندی و الگوریتم­های دسته­بندی استفاده گردید و در انتها براي بهبود نتايج از کدهای پیاده­سازی شده شبکه عصبی و الگوریتم K-means به­عنوان  مدلی برتر استفاده شده است. نتایج این تحقیق اهمیت داده­کاوی در دامنه تخلفات ترافیکی و دیگر ویژگی­های رانندگان را نشان داده است.

کلمات کلیدی: الگوریتم­های داده­کاوی، تخلفات رانندگی، رانندگان متخلف خطرآفرین، خوشه­بندیk-means

 

فهرست مطالب

چکیده………………………………………………………………………………………………………………………………………………….. 1

فصل اول: مقدمه

1-1- تعریف مساله و بیان موضوع اصلی تحقیق…………………………………………………………………………….. 3

1-2- جنبه جدید بودن و نوآوری در تحقیق…………………………………………………………………………………… 4

1-3- اهداف تحقیق…………………………………………………………………………………………………………………………… 5

1-4- فرضیات یا سوالات تحقیق………………………………………………………………………………………………………. 6

1-5- مجموعه داده­ها…………………………………………………………………………………………………………………………. 7

1-6- اهمیت و ضرورت موضوع ……………………………………………………………………………………………………….. 7

1-7- تعریف واژه­ها…………………………………………………………………………………………………………………………….. 8

1-8- محدودیت­ها و دشواری­های تحقیق…………………………………………………………………………………………. 8

1-9- ساختار کلی پایان نامه……………………………………………………………………………………………………………… 9

فصل دوم: پیشینه تحقیق

2-1- مقدمه………………………………………………………………………………………………………………………………………. 13

2-2- تخلفات ترافیکی……………………………………………………………………………………………………………………… 13

2-2-1- انواع تخلفات ترافیکی………………………………………………………………………………………………………… 14

2-2-1-1- تخلفات رانندگی حادثه­­زا………………………………………………………………………………………………. 14

2-2-1-2- تخلفات رانندگی غیرحادثه­زا………………………………………………………………………………………… 14

2-2-2- عوامل تخلفات ترافیکی……………………………………………………………………………………………………… 14

2-2-3- ریشه­های تخلفات ترافیکی………………………………………………………………………………………………… 15

2-2-3-1- تخلفات با علل و ریشه­های انسانی……………………………………………………………………………….. 15

2-2-3-2- تخلفات با علل و ریشه­های عوامل محیطی………………………………………………………………….. 16

2-2-3-3- تخلفات با علل و ریشه­های عوامل قانونی و اجرایی…………………………………………………….. 16

2-2-4- راهکارهای پیشگیری و تعدیل تخلفات ترافیکی………………………………………………………………. 17

2-2-5- آمار تخلفات رانندگی و جریمه های تخصیص یافته  در سه ماهه اول سال 92 در استان کرمان

……………………………………………………………………………………………………………………………………………………………. 17

2-3- داده­کاوی…………………………………………………………………………………………………………………………………. 19

2-3-1- تاریخچه داده­کاوی……………………………………………………………………………………………………………… 20

2-3-2- فرآیند کشف دانش از پایگاه داده…………………………………………………………………………………….. 20

2-3-3- تعریف داده­کاوی………………………………………………………………………………………………………………… 22

2-3-4- کاربردهای داده­کاوی………………………………………………………………………………………………………….. 23

2-3-5- اهداف و ریشه­های داده­کاوی…………………………………………………………………………………………….. 24

2-3-6- آمار و داده­کاوي…………………………………………………………………………………………………………………… 24

2-3-6-1- خلاصه تفاوت­های روش آنالیز آماری و داده­کاوی………………………………………………………. 24

2-3-7- مرور پیشینه تحقیق………………………………………………………………………………………………………….. 25

2-3-8- خلاصه سوابق تحقیق……………………………………………………………………………………………………….. 29

2-3-9- خلاصه فصل………………………………………………………………………………………………………………………. 29

فصل سوم: روش اجرای تحقیق

3-1- مقدمه………………………………………………………………………………………………………………………………………. 31

3-2- روش تحقیق……………………………………………………………………………………………………………………………. 31

3-2- 1- طبقه­بندی تحقیق بر مبنای هدف………………………………………………………………………………….. 31

3-3- فرآیند تحقیق…………………………………………………………………………………………………………………………. 32

3- 4- مدل فرآیندی داده­کاوی براساس استاندارد CRISP_DM…………………………………………… 32

3-4- 1- گام­های متدولوژی داده­کاوی CRISP_DM……………………………………………………………… 32

3-4- 1-1- گام درک موقعیت کسب و کار…………………………………………………………………………………… 33

3-4-1-2- گام درک داده­ها…………………………………………………………………………………………………………….. 33

3-4-1-3- گام پیش­پردازش داده­ها……………………………………………………………………………………………….. 34

3-4-1-4-گام مدل­سازی…………………………………………………………………………………………………………………. 35

3-4-1-5- گام ارزیابی مدل……………………………………………………………………………………………………………. 35

3-4-1-6- گام بکارگیری مدل………………………………………………………………………………………………………… 35

3-5- مدل اجرایی از تحقیق……………………………………………………………………………………………………………. 36

3-6- تکنیک­های داده­کاوی  …………………………………………………………………………………………………………… 38

3-6-1- دسته­­بندی …………………………………………………………………………………………………………………………. 48

3-6-1-1- انواع مدل­ها در کلمنتاین………………………………………………………………………………………………. 49

6-3-2- شبکه­های عصبی   ……………………………………………………………………………………………………………. 50

3- 6-2-1- خصوصيات شبکه­هاي عصبي……………………………………………………………………………………… 51

3- 6-2-2- مزایای شبکه­های عصبی……………………………………………………………………………………………… 52

3-6-2-3- معایب شبکه های عصبی……………………………………………………………………………………………… 52

3-6-3- درخت تصميم­گیری…………………………………………………………………………………………………………… 52

3-6-3-1- نحوه نمایش درخت تصمیم………………………………………………………………………………………….. 52

3-6-3-2- مسائل مهم در درخت تصميم………………………………………………………………………………………. 52

3-6-3-3- خصوصيات درخت تصميم……………………………………………………………………………………………. 52

3- 6-3-4- چگونه يك درخت تصميم گيري رشد مي­كند؟……………………………………………………….. 52

3-6-3-5- مزایای درختان تصمیم نسبت به روش­های دیگر داده­کاوی………………………………………. 52

3-6-3-6- معايب درختان تصمیم………………………………………………………………………………………………….. 52

3-6-4- انواع درختان تصميم………………………………………………………………………………………………………….. 52

3-6-4-1- درخت CART  …………………………………………………………………………………………………………. 52

3-6-4-1-1- مقدمه………………………………………………………………………………………………………………………… 52

3-6-4-1-2- توصیف الگوریتم……………………………………………………………………………………………………….. 52

3-6-4-1-3-روش برخورد با مقادیر ازدست رفته در درختCART………………………………………… 52

3-6-4-1-5- رویه هرس کردن  درخت CART………………………………………………………………………… 52

3-6-4-2- درخت CHAID…………………………………………………………………………………………………………. 52

3-6-4-2- -توصیف الگوریتم CHAID………………………………………………………………………………………. 52

3-6-4-2-2-  نحوه شکستن نودها در درخت CHAID…………………………………………………………… 52

3-6-4-3- درخت C5.0………………………………………………………………………………………………………………… 52

3-6-4-3-1- توصیف الگوریتم……………………………………………………………………………………………………….. 52

3-6-4-3-2- استنتاج قانون از طریق الگوریتم c5.0   ……………………………………………………………… 52

3-6-4-3-3-روش برخورد با مقادیر ازدست رفته در درخت C5.0…………………………………………… 52

3-6-4-3-4-رویه هرس کردن درخت C5.0……………………………………………………………………………….. 52

3-6-4-4- درخت QUEST………………………………………………………………………………………………………… 52

3-6-4-4-1- توصیف الگوریتم……………………………………………………………………………………………………….. 52

3-6-4-5- الگوریتم SVM……………………………………………………………………………………………………………. 52

3-6-4-5-1- توصیف الگوریتم……………………………………………………………………………………………………….. 52

3-6-5- خوشه بندی……………………………………………………………………………………………………………………….. 52

3-6-5-1- روش‌هاي خوشه‌بندي……………………………………………………………………………………………………. 52

3-6-5-2- کيفيت خوشه‌بندي……………………………………………………………………………………………………….. 52

3-6-5-3- نقاط قوت روش خوشه­بندي…………………………………………………………………………………………. 52

3-6-5-4- نقاط ضعف روش خوشه­بندي………………………………………………………………………………………. 52

3-6-5-5- خوشه‌بندي در مقابل دسته­بندی (طبقه‌‌بندي)…………………………………………………………… 52

3-6-5-6- ملاحظات در داده‌کاوي و در زمينه‌ي خوشه‌بندي……………………………………………………… 52

3-6-5-7- الگوریتم ‌ K- Means………………………………………………………………………………………………… 52

3-6-6- قوانین همبستگی(انجمنی)………………………………………………………………………………………………… 52

3-6-6-1-الگوریتم Apriori………………………………………………………………………………………………………… 52

3-6-6-1-1- توصیف الگوریتم……………………………………………………………………………………………………….. 52

3-6-6-1-2- تعاریف و مفاهیم اصلی…………………………………………………………………………………………….. 52

3-6-6-1-3- کد الگوریتم Apriori……………………………………………………………………………………………. 52

3-6-6-1-4-  معایب الگوریتم………………………………………………………………………………………………………… 52

3-7- خلاصه­ فصل……………………………………………………………………………………………………………………………. 52

فصل چهارم : تجزیه و تحلیل داده­های تحقیق

4-1- مقدمه………………………………………………………………………………………………………………………………………. 61

4-2- مجموعه داده مورد استفاده……………………………………………………………………………………………………. 54

4-2- 1 پایگاه­داده تخلفات ترافیکی رانندگان متخلف……………………………………………………………………. 55

4-2-2- مصاديق و عناوين تخلفات رانندگي حادثه‌آفرین……………………………………………………………… 56

4-3- پیش­پردازش داده­ها………………………………………………………………………………………………………………… 57

4-3-1- پاکسازی داده­ها………………………………………………………………………………………………………………….. 58

4-3-2- تبدیل و یکپارچه­سازی داده­ها…………………………………………………………………………………………… 61

4-3-2- کاهش داده­ها………………………………………………………………………………………………………………………. 61

4-3-2- انتخاب ویژگی…………………………………………………………………………………………………………………….. 61

خلاصه فصل………………………………………………………………………………………………………………………………………. 75

 

 

 

 

فصل پنجم: ارائه روش پیشنهادی و نتایج

 

 

فصل ششم: جمع­بندی و پیشنهادات

6-1- مقدمه……………………………………………………………………………………………………………………………………… 115

6-2- خلاصه کارهای انجام شده……………………………………………………………………………………………………. 117

6-3- پاسخ به سوالات تحقیق………………………………………………………………………………………………………… 117

6-4- دستاوردهای تحقیق………………………………………………………………………………………………………………. 117

6-5- ملاحظات تحقیق…………………………………………………………………………………………………………………… 117

6-6- پیشنهاد برای فعالیت­های آینده……………………………………………………………………………………………. 117

 

منابع………………………………………………………………………………………………………………………………………………….. 117

فهرست جداول

 

آمار تخلفات رانندگی و جریمه­های تخصیص یافته…………………………………………………………………… 19

فهرست شکل­ها

ساختار پایان نامه ………………………………………………………………………………………………………………………… 21

فرآیند کشف دانش …………………………………………………………………………………………………………………….. 21

داده کاوی مدل جعبه سیاه ……………………………………………………………………………………………………….. 21

فهرست نمودار­ها

میزان تفهیم فرد متخلف از جانب مامورین……………………………………………………………………………….. 21

پذیرش تخلف انجام گرفته از سوی متخلفین……………………………………………………………………………. 21

آگاهی متخلفین نسبت به تخلف انجام شده……………………………………………………………………………… 21

آگاهی متخلفین از حضور پلیس…………………………………………………………………………………………………. 21

فهرست کلمات اختصاری

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo