%41تخفیف

دانلود پروژه:ارایه روشی جدید جهت تشخیص حروف دست نویس فارسی با استفاده از روش های

تعداد 115صفحه در فایل word

چکیده

هدف از این تحقیق، بهبود بخش‌های استخراج ویژگی و طبقه‌بندی در سامانه بازشناسی حروف دست‌نویس فارسی است. در بخش استخراج ویژگی، پنج روش مختلف که در مقالات مورداستفاده قرارگرفته بررسی‌شده‌اند تا بهترین روش برای این تحقیق انتخاب شود. این روش‌ها شامل آنالیز اجزای اصلی (PCA)، گرادیان تصویر، گرادیان بهبودیافته، ضرایب DCT، گشتاورها و ماتریس GLCM است. در بخش طبقه‌بندی، سه روش جدید بر پایه روش‌های ترکیبی ارائه‌شده است. روش‌های پیشنهادی بر روی 10 مجموعه داده که هر مجموعه شامل 3200 نمونه از حروف دست‌نویس فارسی است آزمایش‌شده است که در بهترین حالت به‌طور متوسط درصد صحت طبقه بند پایه به میزان 10 درصد افزایش‌یافته است.

واژه‌های کلیدی: بازشناسی حروف دست‌نویس فارسی، ترکیب طبقه بندها، استخراج ویژگی، ماشین بردار پشتیبان

فهرست مطالب

فصل ۱، بازشناسی الگو. 3

۱-۱. مقدمه. 4

۱-۲. ساختار کلی پایان‌نامه. 4

۱-۳. بازشناسی الگو. 5

۱-۴. روش‌های طبقه‌بندی الگو. 8

۱-۴-۱. روش‌های حسی-تجربی.. 9

۱-۴-۲. روش‌های ساختاری.. 9

۱-۴-۳. روش‌های ریاضی.. 9

۱-۳-۴-۱. روش‌های آماری.. 10

1-۳-۴-2. روش‌های غیر آماری.. 11

1-۳-۴-3. شبکه‌های عصبی.. 12

1-۴-4. ارزیابی یک طبقه بند. 13

1-۴-5. مقایسه تجربی طبقه بندها 15

۱-۵-۴-۱. انتخاب مجموعه آموزش… 15

۱-۴-۵-۲. انتخاب مجموعه آزمایشی.. 15

۱-۴-۵-۳. تصادفی بودن ذاتی الگوریتم یادگیری.. 16

فصل ۲، تاریخچه و مروری بر سامانه های OCR.. 17

۲-۱. انواع سامانه‌های تشخیص الگو. 18

۲-۱-۱. بازشناسی متون. 18

۲-۱-۱-۱.  OMRچیست؟. 18

۲-۱-۱-۲. ICR چیست؟. 19

۲-۱-۱-۳. OCR چیست؟. 20

۲-۱-۲. تاریخچه سامانه‌های OCR.. 21

۲-۱-۲-۱.  مرحله تکوین (از ۱۹۰۰ تا ۱۹۸۰) 22

۲-۱-۲-۲. مرحله توسعه (از ۱۹۸۰ تا ۱۹۹۰) 23

۲-۱-۲-۳. مرحله بهبود (از ۱۹۹۰ به بعد) 23

۲-۱-۳.  OCR در ایران چگونه آغاز شد. 23

2-۱-4. ﻣﺸﺨﺼﺎت ﻧﻮﺷﺘﺎر ﻓﺎرﺳﻲ.. 24

۲-۲. بخش‌های مختلف سامانه‌های OCR.. 25

2-۲-1. پیش‌پردازش… 25

2-۱-۲-1. کاهش نویز. 26

۲-۲-۱-۲. نرمالیزه کردن داده‌ها 26

2-۱-۲-3. فشرده‌سازی.. 27

۲-۲-۲. بازنمایی (استخراج ویژگی) 28

2-۲-۲-1. آنالیز اجزای اصلی (PCA) 29

۲-2-۲-1-1. ﻣﻔﺎﻫﻴﻢ ﺟﺒﺮ ماتریس‌ها 31

۲-2-۲-1-۲.اﻟﮕﻮرﻳﺘﻢ PCA.. 32

۲-۲-۲-۲. استفاده از گرادیان تصویر. 34

2-۲-۲-۲-1. استفاده از فیلترهای گاووسی.. 37

۲-۲-۲-۲-۲. روش گرادیان بهبودیافته. 37

۲-۲-۲-۲-3. ﺗﺒﺪﻳﻞ ﮔﺴﺴﺘﻪ ﻛﺴﻴﻨﻮﺳﻲ (ضرایب DCT) 38

2-۲-۲-3. گشتاورها و ماتریس GLCM.. 40

2-2-۲-3-1. ماتریس GLCM.. 40

۲-2-۲-3-۲. گشتاورها 41

۲-۲-۳. شناسایی (طبقه‌بندی) 43

۲-۲-۳-۱. ماشین بردار پشتیبان (SVM) 43

۲-۳-۲-۲. درخت تصمیم. 44

فصل ۳، تحقیقات انجام شده در زمینه OCR. 45

3-1. بازشناسی حروف و کلمات دست‌نویس… 46

3-2. بازشناسی دست‌نویس فارسی_عربی.. 47

۳-۳. روند تحقیقات فارسی.. 48

3-4. تحقیقات انجام‌شده در داخل کشور درزمینه تولید OCR فارسی.. 50

فصل ۴، ترکیب طبقه بندها 52

4-1. مقدمه. 53

4-2. ادغام اطلاعات در بازشناسی الگو. 53

4-3. جایگاه سامانه‌های طبقه‌بندی مرکب در بازشناسی الگو. 56

۴-۴. ترکیب طبقه بندها 57

4-۴-1. اهمیت ترکیب طبقه بندها 58

۴-۴-۲. نیازهای اساسی برای ترکیب طبقه بندها 59

۴-۵. روش‌های ایجاد گوناگونی.. 59

4-۵-1. روش‌های ضمنی.. 60

4-5-1-1. گوناگونی درروش بازنمایی الگوی ورودی.. 60

۴-۵-۱-۲. گوناگونی در مجموعه یادگیری.. 60

۴-۵-۱-۳. گوناگونی در روش‌های طبقه‌بندی.. 61

۴-۵-۲. روش‌های صریح.. 61

4-5-2-1. روش‌های تقویتی.. 61

4-5-2-2. روش‌های جریمه‌ای.. 62

4-6. روش‌های متداول برای ترکیب خروجی طبقه بندها 62

4-7. برخی از روش‌های معمول ترکیب طبقه بندها 63

4-۷-1. روش Bagging. 63

4-۷-2. روش Boosting. 64

4-۷-3. روش Random Forest 66

۴-۷-۴. روش ECOC.. 67

فصل ۵، روش های جدید پیاده سازی شده در این تحقیق.. 68

5-1. پایگاه داده 69

۵-۱-۱. پایگاه داده هدی.. 69

۵-۱-۲. پایگاه داده IFHCDB. 70

5-۱-3. پایگاه داده CENPARMI 70

5-۱-4. پایگاه داده ICDAR2009. 71

۵-۱-۵. پایگاه داده حروف گسسته دست‌نویس فارسی.. 71

۵-۲. شرایط و محیط آزمایش… 72

5-3. پیش‌پردازش… 72

5-4. استخراج ویژگی.. 73

۵-۵. طبقه‌بندی.. 74

5-6. روش‌های ارائه‌شده در این تحقیق. 74

5-۶-1. روش پیشنهادی با استفاده از روش‌های ترکیبی پایه. 75

5-6-1-1. خلاصه روش… 75

5-6-1-2. نتایج آزمایش و تحلیل این روش… 76

5-۶-2. روش پیشنهادی با استفاده از ترکیب ماشین بردار پشتیبان مبتنی بر استخراج ویژگی.. 80

5-6-2-1. خلاصه روش… 80

5-6-2-2. مدل پیشنهادی.. 80

5-6-2-3. نتایج آزمایش و تحلیل این روش… 82

5-۶-3. روش پیشنهادی با استفاده از بهبود متد ترکیبی ECOC.. 85

5-6-3-1. خلاصه روش… 85

5-6-3-2. مدل پیشنهادی.. 86

5-6-3-2. نتایج آزمایش و تحلیل این روش… 89

5-7. نتیجه‌گیری.. 92

فصل ۶، نتیجه گیری و پیشنهاد. 94

مراجع. 96

فهرست شکل‌ها

شکل ۱-۱: روند بازشناسی الگو. 6

شکل ۲-۱ : رویکردی برای بازشناسی الگو. 11

شکل ۲-۱: نمونه فرم طراحی‌شده آزمون برای OMR.. 19

شکل ۲-۲: نمونه فرم کاغذی برای ICR.. 20

شکل ۲-۳ : بخش‌های مختلف سیستم OCR.. 21

شکل2-4: برخی از ویژگی‌های نوشتار فارسی.. 25

شکل 2-5: بخش‌های مختلف یک سامانه OCR.. 25

شکل 2-6: محورهای جديد در PCA.. 30

ﺷﻜﻞ ۲-۷: داده‌های اولیه در PCA.. 32

شکل2-8: نتایج حاصل از PCA.. 34

شکل2-9: عملگرهای سوبل. 35

شکل ۲-۱۰: عملگرهای کریش… 35

شکل ۲-۱۱: ۸ جهت پایه برای گرادیان. 36

شکل ۲-۱۲: تصویر کردن یک‌جهت گرادیان به دو جهت پایه. 36

شکل ۲-۱۳: توزیع فرکانسی در ماتریس ضرایب DCT. 39

شکل 2-14: ویژگی‌های جهتی برخی از حروف فارسی.. 41

شکل 4-1. یک تقسیم‌بندی ممکن برای ادغام اطلاعات.. 55

شکل ۴-۲: الگوریتم Bagging. 64

شکل ۴-۳: الگوریتم Adaboost 65

شکل ۴-۴: الگوریتم Random Forest 66

شکل 4-5: روش Random Forest 67

شکل ۵-۱: نمونه‌هایی از پایگاه داده هدی.. 69

شکل ۵-۲: نمونه‌هایی از پایگاه داده IFHCDB. 70

شکل ۵-۳: نمونه‌هایی از پایگاه دادهCENPARMI 70

شکل ۵-۴: نمونه‌هایی از پایگاه داده  ICDAR2009. 71

شکل ۵-۵: نمونه‌هایی از پایگاه داده  حروف گسسته دست‌نویس فارسی.. 72

شکل ۵-۶: چند نمونه از داده‌های استفاده‌شده قبل و بعد از پیش‌پردازش… 73

شکل ۵-۷ : میانگین درصد صحت برای هر تکنیک… 78

شکل ۵-۸: میانگین نتایج حاصل از هر تکنیک با تعداد ویژگی‌های متفاوت.. 79

شکل ۵-۹: الگوریتم پیشنهادی ترکیب طبقه‌بندها مبتنی بر استخراج ویژگی.. 81

شکل ۵-۱۰: تأثیر پارامتر K.. 83

شکل ۵-۱۱ : تأثیر پارامتر C.. 84

شکل ۵-۱۲: میانگین درصد صحت برای هر تکنیک… 85

شکل ۵-۱۳: فلوچارت روند کاری روش ECOC.. 86

شکل ۵-۱۴: یک طراحی برای روش ECOC.. 87

شکل ۵-۱۵: الگوریتم آموزش روش ECOC.. 88

شکل ۵-۱۶: الگوریتم ارزیابی روش ECOC.. 89

شکل ۵-۱۷: میانگین درصدصحت حاصل از ۱۰ بار اجرای هر تکنیک… 90

شکل ۵-۱۸ : میزان درصد صحت با طول کدهای متفاوت.. 91

شکل ۵-۱۹ : میانگین نتایج حاصل از هر تکنیک با استفاده از تعداد ویژگی‌های متفاوت.. 92

فهرست جدول‌ها

جدول ۵-۱: نتایج حاصل از روش‌های مختلف استخراج ویژگی………………………………..………..……73

جدول ۵-۲: نتایج حاصل از ارزیابی روش های طبقه‌بندی پایه…………………………………………………74

جدول ۵-۳: مقایسه روش‌های مختلف دسته‌بندی در روش پیشنهادی اول…………………..……………….77

جدول ۵-۴: نتایج حاصل از ارزیابی  روش پیشنهادی دوم…………………..………………………………….82

جدول ۵-۵: نتایج حاصل از ارزیابی روش پیشنهادی سوم……………………….….………………………….89

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo