سایت مرجع دانلود پایان نامه -پشتیبانی 09199970560

پایان نامه پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

ارسال شده در سایت پایان نامه

وزارت علوم، تحقیقات و فناوری

دانشگاه علوم و فنون مازندران

پایان نامه مقطع کارشناسی ارشد

رشته فناوری اطلاعات/مدیریت سیستم های اطلاعاتی

عنوان :

پیش پردازش داده های نا متوازن با استفاده از ماشین بردار پشتیبان

استاد راهنما : جناب دکتر جواد وحیدی

استاد مشاور : جناب دکتر بابک شیرازی

زمستان 1392

برای رعایت حریم خصوصی نام نگارنده پایان نامه درج نمی شود

(در فایل دانلودی نام نویسنده موجود است)

تکه هایی از متن پایان نامه به عنوان نمونه :

(ممکن است هنگام انتقال از فایل اصلی به داخل سایت بعضی متون به هم بریزد یا بعضی نمادها و اشکال درج نشود ولی در فایل دانلودی همه چیز مرتب و کامل است)

چکیده

برای دست یابی به نتایج مطلوب در داده کاوی نیاز به پیش پردازش داده ها داریم.پیش پردازش داده ها یکی از اجزای مهم در فرایند کشف دانش است.روش های بسیاری برای پیش پردازش داده وجود دارد که می­توان از آنها استفاده کرد.اما این روش ها برای داده های نامتوازن مناسب نیستند. اصطلاح “مجموعه داده نامتوازن” عموما به مجموعه داده‌ای گفته می‌شود که در آن تعداد نمونه‌هایی که نمایانگر یک کلاس هستند از نمونه‌های دیگر در کلاس‌های متفاوت کمتر است مشکل عدم توازن کلاس در بسیاری از برنامه های کاربردی جهان واقعی به رسمیت شناخته شده است و موضوع تحقیقات یادگیری مبتنی بر ماشین قرار گرفته است از این رو اخیراً مشکل نامتوازن بودن کلاسها مورد توجه محققان در زمینهی دادهکاوی قرار گرفته است.آنها به دنبال کشف روش هایی بودند که با اعمال بر روی داده های نامتوازن به نتایج مطلوبی دست یابند.

در این پروژه روش های گوناگون پیش پردازش داده های نامتوازن مورد بحث قرار گرفته و الگوریتم جدیدی برای بهبود نتایج طبقه بندی ارائه می­شود، به گونه ای که کارایی و دقت آن مورد توجه باشد.

 

 

 

 

کلمات کلیدی : پیش پردازش داده، مجموعه داده نامتوازن، ماشین بردار پشتیبان

فهرست مطالب

فصل اول مقدمه و کلیات تحقیق

1-1مقدمه………………………………………………………………………………………………………… 2

1-2بیان مساله…………………………………………………………………………………………………… 2

1-3 اهداف تحقیق…………………………………………………………………………………………….. 4

1-4 پرسش های اصلی تحقیق……………………………………………………………………………… 4

1-5فرضیه های تحقیق……………………………………………………………………………………….. 4

1-6 نوآوری تحقیق……………………………………………………………………………………………. 5

1-7 تعریف واژگان کلیدی………………………………………………………………………………….. 5

1-8 ساختار پایان نامه………………………………………………………………………………………… 9

فصل دوم ادبیات و پیشینه تحقیق

2-1 مقدمه…………………………………………………………………………………………………….. 11

2-2 مفاهیم داده کاوی……………………………………………………………………………………… 11

2-2-1 تعاریف داده کاوی………………………………………………………………………………. 11

2-2-2 فرایند کشف دانش……………………………………………………………………………… 12

2-2-3 حوزه ها و عملکردهای داده کاوی…………………………………………………………… 12

2-3  کاربردهای داده کاوی و کشف دانش……………………………………………………………. 14

2-4 چالش هایی برای KDD………………………………………………………………………………. 15

2-5 پیش پردازش و آماده سازی داده ها :…………………………………………………………….. 16

2-5-1اجزای اصلی پیش پردازش داده ها…………………………………………………………… 17

2-5-1-1 پاکسازی داده ها………………………………………………………………………… 18

2-5-1-2یکپارچه سازی داده ها………………………………………………………………….. 20

2-5-1-3 تبدیل داده ها…………………………………………………………………………….. 20

2-5-1-3-1هموار سازی……………………………………………………………………….. 20

2-5-1-3-2 تجمیع……………………………………………………………………………… 21

2-5-1-3-3 تعمیم……………………………………………………………………………….. 21

2-5-1-3-4 ساخت ویژگی……………………………………………………………………. 21

2-5-1-3-5 نرمال سازی……………………………………………………………………….. 21

2-5-1-4 کاهش داده ها……………………………………………………………………………. 21

2-5-1-4-1 تجمیع مکعبی داده………………………………………………………………. 23

2-5-1-4-2 انتخاب زیر مجموعه مشخصه ها…………………………………………….. 23

2-5-1-4-3 کاهش تعدد نقاط………………………………………………………………… 24

2-5-1-5 تصویر کردن برای کاهش بعد………………………………………………………… 24

2-6 روش های ارزیابی دسته بندی……………………………………………………………………… 25

2-6-1 ارزیابی صحت روشهای دسته بندی…………………………………………………………. 27

2-7  تکنیک حداقل مربعات………………………………………………………………………………. 30

2-7-1 تقریب کمترین مربعات گسسته چند جمله ای…………………………………………… 31

2-8 ماشین بردار پشتیبان…………………………………………………………………………………… 33

2-8-1مقدمه………………………………………………………………………………………………. 33

2-8-2دلایل استفاده از SVM………………………………………………………………………….. 34

2-8-3 کاربردهای SVM…………………………………………………………………………………. 35

2-8-4 مزایا و معایب SVM…………………………………………………………………………….. 36

2-8-5 تعاریف کلی………………………………………………………………………………………. 36

2-8-5-1تابع تصمیم مسائل دو کلاسی…………………………………………………………. 36

2-8-5-2 تعیین تابع تصمیم(ابر صفحه جداکننده)……………………………………………. 38

2-8-5-3 بعد VC……………………………………………………………………………………. 39

2-8-5-4حداقل سازی ریسک تجربی………………………………………………………….. 40

2-8-5-5حداقل سازی ریسک ساختاری……………………………………………………….. 42

2-8-6 ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا شدنی به طور خطی 44

2-8-7ماشین بردار پشتیبان طبقه بندی کننده خطی با داده های جدا نشدنی به طور خطی (   49

2-8-8 ماشین بردار پشتیبان غیر خطی…………………………………………………………….. 52

2-8-9 انواع کرنل ها…………………………………………………………………………………….. 55

2-8-9-1 کرنل چند جمله ای…………………………………………………………………….. 55

2-8-9-2 کرنل های شبکه عصبی………………………………………………………………… 55

2-8-9-3  کرنل های گوسی………………………………………………………………………. 56

2-9 تکنیک های پیش پردازش نامتوازن………………………………………………………………… 58

2-9-1 ماشین بردار پشتیبان و مشکل عدم توازن کلاس……………………………………….. 58

2-9-1-1  عیب مشکل بهینه سازی با ناحیه مرزی نرم………………………………………. 59

2-9-1-2 نسبت بردار پشتیبان نامتوازن…………………………………………………………. 60

2-9-2  روشهای یادگیری عدم توازن خارجی برای SVM (روشهای پیش پردازش داده)       61

2-9-2-1  روشهای نمونه برداری دوباره……………………………………………………….. 61

2-9-2-1-1زیر نمونه برداری…………………………………………………………………. 61

2-9-2-1-2بیش نمونه برداری………………………………………………………………… 62

2-9-2-1-3 SCM………………………………………………………………………………… 63

2-9-2-1-4 نمونه برداری پیشرفته…………………………………………………………… 63

2-9-2-1-5 تکنیک بیش نمونه برداری اقلیت مصنوعی…………………………………. 64

2-9-2-1-6 نزدیک ترین همسایه فشرده(CNN)………………………………………….. 64

2-9-2-1-7 نزدیک ترین همسایه تغییر یافته(ENN)……………………………………… 66

2-9-2-1-8 Tomek-Link…………………………………………………………………….. 67

2-9-2-2 روشهای یادگیری جمعی……………………………………………………………… 68

2-9-2-2-1الگوریتم آموزشی Bagging……………………………………………………… 69

2-9-2-2-2 الگوریتم آموزشی Boosting…………………………………………………… 70

2-9-3 روشهای یادگیری عدم تعادل داخلی برای ماشین بردار پشتیبان                                    71

2-9-3-1 هزینه خطای متفاوت…………………………………………………………………… 71

2-9-3-2 یادگیری یک کلاس…………………………………………………………………….. 73

2-9-3-3zSVM………………………………………………………………………………………. 73

2-9-3-4 روشهای اصلاح کرنل………………………………………………………………….. 74

2-9-3-5 یادگیری فعال……………………………………………………………………………. 75

2-9-3-6 روش های ترکیبی………………………………………………………………………. 75

فصل سوم:روش تحقیق

3-1مقدمه……………………………………………………………………………………………………… 77

3-2 ماشین بردار پشتیبان فازی برای یادگیری عدم توازن کلاس…………………………………. 77

3-2-1 روش SVMFuzzy………………………………………………………………………………. 77

3-2-2متد FSVM-CIL…………………………………………………………………………………. 79

3-3 ماشین بردار پشتیبان حداقل مربعات (LS-SVM)……………………………………………….. 83

3-4 الگوریتم پیشنهادی…………………………………………………………………………………….. 87

فصل چهارم:محاسبات و یافته های تحقیق

4-1 مقدمه…………………………………………………………………………………………………….. 90

4-2  مجموعه داده ها………………………………………………………………………………………. 90

4-3 نتایج کارایی روش های مختلف بر روی مجموعه داده ها……………………………………. 91

فصل پنجم:نتیجه گیری و پیشنهادات

5-1 جمع بندی و نتیجه گیری……………………………………………………………………………. 94

5-2 کارهای آتی…………………………………………………………………………………………….. 96

منابع و مآخذ :………………………………………………………………………………………. 97

چکیده انگلیسی……………………………………………………………………………………………………….102

برای دانلود متن کامل پایان نامه اینجا کلیک کنید

 

مطالب مشابه را هم ببینید

141985615752731

فایل مورد نظر خودتان را پیدا نکردید ؟ نگران نباشید . این صفحه را نبندید ! سایت ما حاوی حجم عظیمی از پایان نامه ، تحقیق ، پروژه و مقالات دانشگاهی در رشته های مختلف است. مطالب مشابه را هم ببینید یا اینکه برای یافتن فایل مورد نظر کافیست از قسمت جستجو استفاده کنید. یا از منوی بالای سایت رشته مورد نظر خود را انتخاب کنید و همه فایل های رشته خودتان را ببینید فروش آرشیو پایان نامه روی دی وی دی

aca@

academicbooks@

پایان نامه مقایسه میزان رضایت زناشویی و امیدواری در بین مادران کودکان عادی و استثنایی در شهر کرمانشا...
پایان نامه بررسی مواد تشکیل دهنده اسانس و عصاره چند گونه از گیاهان بومی شمال ایران مانند گونه گیاهی...
پایان نامه ارتباط سطح تحصیلات مادران با پیشرفت تحصیلی دختران
پایان نامه عملکرد تحصیلی بر اساس هوش اخلاقی و مهارت های اجتماعی در بین دانش آموزان
دانلود پایان نامه : بررسی بی تابعیتی، طبق کنوانسیون های بین المللی