%37تخفیف

دانلود پروژه:ارائه روشی در جهت بهبود پیش‏بینی خطای نرم‏افزار

تعداد 86صفحه در فایل word

چکیده

ارائه روشی در جهت بهبود پیش‏بینی خطای نرم‏افزار

تشخیص خطای نرم‏افزار از جمله معمول‏ترین روش‏های تضمین کیفیت نرم‏افزار است. مطالعات مختلفی نشان داده‏اند که تشخیص خطا به واقع مفید است. البته با نبود داده‏های مناسب، پیش‏بینی خطا در عمل قابل استفاده نیست. برای رفع این مشکل شیوه‏های متخلفی تحت عنوان روش‏های بین شرکتی توسط مطالعات اخیر پیشنهاد شده است که تلاششان بهره جستن از داده‏های مرتبط است. در پیش‏بینی خطای بین شرکتی داده‏های آموزش و آزمایش از شرکت‏های مختلف است و در نتیجه توزیع‏های متفاوتی دارند. با اینکه بسیاری از مطالعات تفاوت توزیع فراوانی بین مجموعه داده‏های آزمایش و آموزش را به عنوان سختی اصلی تشخیص خطای بین شرکتی عنوان کرده‏اند ولی همواره به یافتن نمونه‏های آموزشی مشابه با نمونه‏های آزمایشی محدود شده‏اند. در این مطالعه ما یک روش ساده و نوین که توزیع فراوانی مجموعه داده‏ی آموزشی را به مجموعه داده‏ی آزمایش دگرگون می‏کند. روش پیشنهادی، با استفاده از دسته‏بندی اقدام به ساخت توزیع داده‏های آموزشی و آزمایشی می‏کند. سپس با اختصاص وزن به هر نمونه آزمایش با توجه به توزیع‏های آموزش و آزمایش، شبیه کردن توزیع آزمایش به توزیع آموزش انجام می‏شود. روش پیشنهادی را بر روی مجموعه داده‏های عمومی از دو شرکت کاملا متفاوت NASA و SOFTLAB امتحان کردیم. ارزیابی و نتایج عددی روش پیشنهادی، رشد چشمگیری در عملکرد از منظر معیار اِف را نشان می‏دهد. روش پیشنهادی توزیع داده‏های آموزشی را برای مشابه شدن با توزیع آزمایش به وسیله‏ی اختصاص وزن به هر یک از نمونه‏های آموزشی دگرگون می‏کند. با توجه به معرفی تفاوت توزیع بین مجموعه داده‏های آزمایشی و آموزشی به عنوان عامل اصلی دشواری پیش‏بینی خطای نرم‏افزار بین شرکتی توسط تعداد زیادی از کارهای گذشته، راهکار پیشنهادی قدمی طبیعی در جهت بهبود پیش‏بینی خطای بین شرکتی است. نتایج به‏دست آمده، حاکی از مناسب بودن راهکار پیشنهادی در جهت بهبود پیش‏بینی خطای نرم‏افزار است.

فهرست

1 مقدمه ……………………………………………………………………………………………………………………………………………………….

2

1.1 ضرورت انجام تحقیق ……………………………………………………………………………………………………………………………

6

1.2 هدف از انجام تحقیق ……………………………………………………………………………………………………………………………

7

1.3 فرضیات و محدودیت‏های مسئله …………………………………………………………………………………………………………

7

1.4 سرفصل مطالب …………………………………………………………………………………………………………………………………….

8

2 تعاریف و مفاهیم اولیه ……………………………………………………………………………………………………………………………..

11

2.1 مقدمه ……………………………………………………………………………………………………………………………………………………

11

2.2 طبقه‏بند ………………………………………………………………………………………………………………………………………………..

12

2.3 طبقه‏بند بیزین ……………………………………………………………………………………………………………………………………..

12

2.4 طبقه‌بند بیز ساده …………………………………………………………………………………………………………………………………

14

2.5 درخت تصمیم ………………………………………………………………………………………………………………………………………

15

2.6 طبقه‏بند درخت تصادفی ………………………………………………………………………………………………………………………

16

2.7 طبقه‌بند رگرسیون لجستیک ……………………………………………………………………………………………………………….

16

2.8 شبکه‏های عصبی مصنوعی …………………………………………………………………………………………………………………..

17

2.9 نزدیک‏ترین همسایه ……………………………………………………………………………………………………………………………..

18

2.10 معیارهای سنجش عملکرد ………………………………………………………………………………………………………………..

19

2.10.1 ماتریس درهم …………………………………………………………………………………………………………………………………

19

2.10.2         احتمال تشخیص ……………………………………………………………………………………………………………………………

21

2.10.3         صحت …………………………………………………………………………………………………………………………………………….

21

2.10.4         احتمال هشدار اشتباهی ………………………………………………………………………………………………………………..

21

2.10.5         معیار اِف …………………………………………………………………………………………………………………………………………

22

2.10.6         معیار جی ……………………………………………………………………………………………………………………………………….

22

2.10.7         مساحت زیر منحنی ……………………………………………………………………………………………………………………….

23

2.11 آزمون من-ویتنی ……………………………………………………………………………………………………………………………….

24

2.12 انتقال یادگیری ………………………………………………………………………………………………………………………………….

25

2.13 جمع‏بندی ………………………………………………………………………………………………………………………………………….

26

3 مروری بر تحقیقات پیشین ……………………………………………………………………………………………………………………..

28

3.1 مقدمه ……………………………………………………………………………………………………………………………………………………

28

3.2 مطالعه‏های مرتبط با پیش‏بینی خطای نرم‏افزار …………………………………………………………………………………..

29

3.3 روش‏های انتقال یادگیری در پیش‏بینی خطای نرم‏افزار ……………………………………………………………………..

32

3.4 جمع‏بندی …………………………………………………………………………………………………………………………………………….

36

4 روش کار …………………………………………………………………………………………………………………………………………………..

38

4.1 مقدمه ……………………………………………………………………………………………………………………………………………………

38

4.2 نمایش مسئله ……………………………………………………………………………………………………………………………………….

39

4.3 مجموعه داده‏های پیش‏بینی خطا ………………………………………………………………………………………………………..

39

4.4 پیش پردازش ……………………………………………………………………………………………………………………………………….

40

4.4.1 یکسان‏سازی برچسب کلاس‏ها …………………………………………………………………………………………………………

40

4.4.2 نرمال‏سازی ……………………………………………………………………………………………………………………………………….

41

4.4.3 گسسته‏سازی …………………………………………………………………………………………………………………………………….

41

4.5 طبقه‏بند بیز وزن‏دار ……………………………………………………………………………………………………………………………..

42

4.6 روش پیشنهادی ……………………………………………………………………………………………………………………………………

45

4.6.1 ساخت توزیع فراوانی ………………………………………………………………………………………………………………………..

45

4.7 دگرگونی توزیع فراوانی ………………………………………………………………………………………………………………………..

49

4.8 الگوریتم ………………………………………………………………………………………………………………………………………………..

52

4.8.1 پیچیدگی محاسباتی …………………………………………………………………………………………………………………………

53

4.9 جمع‏بندی …………………………………………………………………………………………………………………………………………….

54

5 آزمایشات و نتایج عددی ………………………………………………………………………………………………………………………….

56

5.1 مقدمه ……………………………………………………………………………………………………………………………………………………

56

5.2 مجموعه داده ………………………………………………………………………………………………………………………………………..

57

5.3 سنجش عملکرد ……………………………………………………………………………………………………………………………………

59

5.4 سنگ میزان ………………………………………………………………………………………………………………………………………….

59

5.5 بستر آزمایش ………………………………………………………………………………………………………………………………………..

60

5.5.1 آموزش بر داده‏های NASA و آزمایش بر داده‏های SOFTLAB ………………………………………………..

61

5.5.2 آموزش بر داده‏های NASA و آزمایش بر داده‏های NASA …………………………………………………………

61

5.6 نتایج ……………………………………………………………………………………………………………………………………………………..

62

5.7 جمع‏بندی …………………………………………………………………………………………………………………………………………….

68

6 نتیجه‏گیری و کارهای آتی …………………………………………………………………………………………………………………………..

70

7 فهرست منابع و مآخد …………………………………………………………………………………………………………………………………..

72

 

فهرست شکل‏ها

شکل 1: حالت‏های مختلف یک منحنی مشخصه عملکرد گیرنده. 23

شکل 2: یادگیری ماشین سنتی در مقابل انتقال یادگیری [9]. 26

شکل 3: توزیع فراوانی معیار تعداد خط‏های کد. 46

شکل 4: تاثیر تعداد یا عرض دسته‏ها بر روی توزیع فراوانی. 47

شکل 5: حالات مختلف فراوانی دسته‏های مجموعه داده آموزشی و آزمایشی نسبت به هم. 49

شکل 6: مقایسه معیار عملکرد PF بین روش پیشنهادی و روش‏های گذشته. 62

شکل 7: مقایسه معیار عملکرد PD بین روش پیشنهادی و روش‏های گذشته. 63

شکل 8: مقایسه معیار عملکرد F-measure بین روش پیشنهادی و روش‏های گذشته. 64

شکل 9: اثر اندازه داده‏های آموزشی بر عملکرد روش پیشنهادی بر روی مجموعه داده ar3. 66

شکل 10:: اثر اندازه داده‏های آموزشی بر عملکرد روش پیشنهادی بر روی مجموعه داده ar4. 66

شکل 11: اثر اندازه داده‏های آموزشی بر عملکرد روش پیشنهادی بر روی مجموعه داده ar5. 67

فهرست جدول‏ها

جدول 1: مارتیس درهم. 20

جدول 2: پیچیدگی محاسباتی روش پیشنهادی. 53

جدول 3: مشخصات مجموعه داده‏های مورد استفاده در آزمایش عملکرد روش پیشنهادی. 58

جدول 4: معیارهای مورد استفاده در آزمایش عملکرد روش پیشنهادی. 58

جدول 5: نتایج حاصل از آزمایش در بستر اول. 65

جدول 6: نتایج حاصل از آزمایش در بستر دوم. 68

قبلا حساب کاربری ایجاد کرده اید؟
گذرواژه خود را فراموش کرده اید؟
Loading...
enemad-logo