%41تخفیف

دانلود پروژه: تشخیص احساس از روی گفتار با استفاده از مدل کلاسبندی ترکیبی  

تعداد 90 صفحه در فایل word

  کارشناسی ارشد

رشته مهندسی کامپیوتر- هوش وصنوعی

 

تشخیص احساس از روی گفتار با استفاده از مدل کلاسبندی ترکیبی

 

چکیده :

گفتار سریع­ترین و طبیعی­ترین روش برای ارتباط بین انسان­ها است. این حقیقت که گفتار می­تواند سریع­ترین و کاراترین روش تعامل بین انسان و کامپیوتر باشد، باعث تحریک محققان برای فعالیت در زمینه پردازش گفتار شد. در سال­های اخیر یک زمینه تحقیقاتی با نام تشخیص احساس از روی گفتار معرفی شده است که حالت احساسی گوینده را از روی گفتار وی مشخص می­کند. اعتقاد بر این است که تشخیص احساس از روی گفتار می­تواند برای استخراج معانی مفید از روی گفتار استفاده شود و از این جهت کارایی سیستم­های تشخیص گفتار را بهبود بخشد. در ای‍ن‌ پ‍ای‍ان‌ن‍ام‍ه‌، ویژگی­های MFCC و GFCC از س‍ی‍گ‍ن‍ال‌ گ‍ف‍ت‍ار، استخراج و م‍ورد ت‍ح‍ل‍ی‍ل‌ ق‍رار گ‍رف‍ت‍ه‌ و سیستم ترکیبی جدیدی‌ ارائ‍ه‌ ش‍ده‌ اس‍ت‌. وی‍ژگ‍ی‌های‌ ص‍وت‍ی‌ م‍ورد ن‍ظر از ف‍ری‍م‌های‌ م‍ت‍وال‍ی‌ س‍ی‍گ‍ن‍ال‌ گ‍ف‍ت‍ار اس‍ت‍خ‍راج‌ و وی‍ژگ‍ی‌های‌ آم‍اری‌ ای‍ن‌ ف‍ری‍م‌ها ب‍ه‌ ع‍ن‍وان‌ ب‍ردار وی‍ژگ‍ی‌ در ن‍ظر گ‍رف‍ت‍ه‌ م‍ی‌ش‍ون‍د. ب‍ع‍د از استخراج  و کاهش وی‍ژگ‍ی‌های‌ م‍ورد ن‍ظر، ت‍وس‍ط سیستم پیشنهادی با ترکیب کلاس­بندهای ماشین بردار پشتیبان و مدل مخلوط گاوسی، توسط کلیشه تصمیم، عمل ک‍لاس‌بندی‌ ب‍رای‌ ه‍ف‍ت‌ ک‍لاس‌ اح‍س‍اس‍ی‌ از پ‍ای‍گ‍اه‌ داده‌ی‌DB-EMO ان‍ج‍ام‌ م‍ی‌گیرد. ن‍ت‍ای‍ج‌ ن‍ش‍ان‍گ‍ر دق‍ت‌ ب‍س‍ی‍ار م‍طل‍وب‌ طب‍ق‍ه‌ب‍ن‍دی‌ ب‍ا اس‍ت‍ف‍اده‌ از سیستم پیشنهادی م‍ی باشد. همچنین کارایی  ویژگی جدید GFCC در تشخیص احساس با استفاده از سیستم پیشنهادی مورد بررسی قرار گرفته است.

تشخیص احساس از روی گفتار با استفاده از مدل کلاسبندی ترکیبی

فهرست مطالب

فصل 1: مقدمه. 1

1-1 پیشگفتار. 2

1-2 تشخیص احساس بر مبنای گفتار. 2

1-3 نوآوری های این پایان نامه. 5

1-4 ساختار کلی پایان نامه. 6

فصل 2 : مروری بر روش­های موجود در تشخیص احساس و بررسی کارهای انجام شده   7

2-1 پیشگفتار. 8

2-2 تعریف احساس… 8

2-2-1 انواع احساس… 8

2-2-2  احساسات واقعی، فراخوانده شده و شبیه سازی شده 10

2-2-2-1  واقعی.. 11

2-2-2-2  برانگیخته شده 11

2-2-2-3  شبیه سازی شده 12

2-2-3 روشهای تخصیص برچسب به داده های احساسی.. 12

2-2-3-1 تخصیص توسط شنوندگان مستقل.. 12

2-2-3-2 تخصیص احساسات برانگیخته شده 12

2-2-4 مجموعه داده های شناخته شده و در دسترس: 13

2-2-5 وابستگی احساس به زبان، فرهنگ و محیط اجتماعی.. 14

2-2-6 بیان احساسات مستقل از گوینده 15

2-2-7 بیان احساس وابسته به جنسیت.. 15

2-3 چرا مطالعه گفتار احساسی حائز اهمیت است؟. 16

2-3-1 کاربردهای تکنولوژی تشخیص احساس… 17

2-3-1-1 احساس در سیستم­های آموزش الکترونیکی.. 17

2-3-1-2 سنتز گفتار احساسی.. 17

2-3-1-3 احساس در گفتار فشرده شده 18

2-3-1-4 تاثیر احساس روی تشخیص احساس و گوینده 18

2-3-1-5 عوامل هوش مصنوعی.. 18

2-3-1-6 تشخیص احساس در مراکز تلفن.. 19

2-3-1-7 تشخیص احساس در تکنولوژی دروغ سنجی.. 19

2-3-1-8 تشخیص احساس در روانشناسی، پزشکی و علوم رفتاری.. 19

2-3-2 مزایای تحقیقات گفتار احساسی در صنعت و جامعه. 20

2-3-2-1 مزایای امنیت ملی.. 20

2-3-2-2 مزایای روانشناسی و پزشکی.. 21

2-3-2-3 مزایای سیستم­های ارتباطی انسان – کامپیوتر. 21

2-3-2-4 مزایای صنعت سرگرمی و رسانه­ها 21

2-4 روشهای موجود در تشخیص خودکار احساسات در گفتار. 21

2-4-1 سطوح تجزیه و تحلیل گفتار احساسی.. 22

2-4-2 چهارچوب کلی تشخیص احساس به صورت خودکار. 22

2-4-3 روشهای موجود استخراج ویژگی در تحلیل احساس گفتاری.. 25

2-4-3-1 ویژگی­های آوایی، فرکانس پایه، فرمنت­ها، انرژی و ریتم. 25

2-4-3-2 ضرایب کپسترال فرکانسی مل (MFCC). 26

2-4-3-3 ویژگی­های مبتنی بر اپراتور انرژی Teager (TEO). 28

2-4-3-4 ویژگیهای مربوط به چاک­نای.. 29

2-4-3-5 تاثیر باندهای فرکانسی مختلف بر تمایز احساسات.. 30

2-4-4 روشهای موجود انتخاب ویژگی برای گفتار احساسی.. 30

2-4-5 تکنیک­های طبقه­بندی موجود برای گفتار احساسی.. 33

2-4-5-1 طبقه­بندی نزدیکترین k همسایگی (KNN). 34

2-4-5-2 ماشین بردار پشتیبان (SVM). 35

2-4-5-3 مدل مخلوط گاوسی (GMM). 36

2-4-5-4 مدل مخفی مارکف (HMM). 37

2-4-5-5 شبکه­های عصبی مصنوعی (ANN). 38

2-5 جمع بندی.. 40

فصل 3: سیستم تشخیص خودکار احساس با استفاده از مدل کلاس­بندی ترکیبی   41

3-1 پیشگفتار. 42

3-2 سیستم تشخیص خودکار احساس انسان از روی گفتار. 43

3-2-1 پیش پردازش… 44

3-2-2 اعمال پنجره 45

3-2-3 استخراج ویژگی.. 47

3-2-3-1 ضرایب کپسترال فرکانس مل (MFCC). 47

3-2-3-2 ضرایب انرژی.. 49

3-2-3-3 ضرایب کپسترال فرکانسGammatone (GFCCs). 50

3-2-4 انتخاب ویژگی: 53

3-2-5 طبقه­بندی ترکیبی.. 55

3-2-5-1 مدل مخلوط گاوسی.. 56

3-2-5-2 ماشین بردار پشتیبان. 57

3-2-5-3 روش کلیشه تصمیم. 59

3-3 پایگاه داده مورد استفاده در این پایان نامه. 60

3-4 جمع­بندی.. 61

فصل 4: پیاده سازی، نتایج عملی و نتیجه گیری.. 62

4-1 پیشگفتار. 63

4-2 روش ارائه و تحلیل نتایج.. 64

4-3 نتایج پیاده سازی.. 64

4-3-1 نتایج انتخاب ویژگی با استفاده از روش رپر: 64

4-3-2 نتایج طبقه­بندی سیستم ترکیبی پیشنهادی : 65

4-3-3 نتایج عملکرد ویژگی جدید GFCC. 67

4-4 نتیجه­گیری و پیشنهادات آینده : 70

فهرست منابع. 170

 

فهرست شکل­ها

شکل(2-1) داده های گفتاری احساسی موجود………………………………………………………………………………………………. 14

شکل (2-2) نمودار بلوکی از تشخیص و طبقه بندی خودکار احساس در گفتار…………………………………………………. 23

شکل(1-3) ساختار سیستم تشخیص احساس………………………………………………………………………………………………… 43

شکل(2-3) پیش تأکید سیگنال…………………………………………………………………………………………………………………….. 45

شکل(3-3) نمودار فرکانس مل……………………………………………………………………………………………………………………. 47

شکل(4-3) استخراج ویژگی MFCC……………………………………………………………………….. 48

شکل(5-3) انرژی………………………………………………………………………………………………………………………………………. 48

شکل(6-3) استخراج ویژگی GFCC……………………………………………………………………….. 52

شکل (7-3) روش رپر………………………………………………………………………………………………………………………………. 53

شکل (8-3) روش فیلتر…………………………………………………………………………………………………………………………….. 54

شکل(9-3) ساختار سیستم پیشنهادی ترکیبی………………………………………………………………………………………………… 54

شکل(4-1) مقایسه عملکرد سیستم پیشنهادی با هر یک از طبقه­بندها………………………………………………………………. 66

شکل(4-2) مقایسه GFCC و MFCC……………………………………………………………………… 68

 

فهرست جداول

جدول(4-1)  ابعاد ویژگی MFCC………………………………………………………………………………………………………. 62

جدول(4-2)  ابعاد ویژگی GFCC………………………………………………………………………………………………………. 62

جدول(4-3) ویژگیهای انتخاب شده برای MFCC………………………………………………………………………………….. 63

جدول(4-4) ویژگیهای انتخاب شده برای GFCC…………………………………………………………………………………… 64

جدول(4-5) نتایج مربوط به مدل مخلوط گاوسی…………………………………………………………………………………… 65

جدول(4-6) نتایج مربوط به ماشین بردار پشتیبان…………………………………………………………………………………… 65

جدول(4-7) نتایج مربوط به سیستم پیشنهادی ترکیبی……………………………………………………………………………… 65

جدول(4-8) نتایج مربوط به GFCC……………………………………………………………………………………………………. 67

جدول(4-9) نتایج مربوط به MFCC…………………………………………………………………………………………………… 67

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo