۱-۶-۱- کالیبراسیون یک متغیره و چند متغیره
مراحل کالیبراسیون معمولا شامل طراحی آزمایش، انتخاب مدل، تخمین پارامترها و پیشبینی مجهولات میباشد. در کالیبراسیون یک متغیره، امکان تصحیح مزاحمها بدون وارد کردن اطلاعات اضافی وجود ندارد، در حالی که در روشهای چند متغیره قادر به جدا کردن اطلاعات مفید از اطلاعات نامناسب مانند خطا میباشند، بدون این که اطلاعات اضافی دیگری برای این کار لازم میباشد ]۶[.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
۱-۶-۲- حداقل مربعات کلاسیک(CLS)[26]
روش بسیار محبوب برای محاسبه برآورد پارامترها و تناسب داده هاست. این روش یکی از قدیمی ترین تکنیک های آماریست که در داده های چند متغیره و در مدل های طیف سنجی مورد استفاده قرار می گیرد ]۷[.
۱-۶-۳- حداقل مربعات معکوس(ILS)[27]
واژه حداقل مربعات توصیفی از یک رویکرد برای حل معادلات از روی عدم دقت در مفهوم تقریبی است. به جای حل دقیق معادلات، به دنبال به حداقل رساندن مجموع مربعات باقیمانده می باشد. حداقل معیار مربع دارای تفسیرهای مهم آماری است. یکی از این تفسیرهای مهم زمانی است که مفروضات مناسب، احتمالاتی در مورد توزیع خطا زمینه ای ایجاد نمایند که در این حالت حداقل مربعات، برآورد حداکثر احتمال از پارامترهای شناخته شده را بدست می دهد ]۸[.
۱-۶-۴- رگرسیون خطی چندگانه (MLR)[28]
با روش های مطالعاتی چند متغیره، می توان همزمان به بررسی و تحلیل چندین متغیر مختلف پرداخت. برای دسترسی به نتایج مطلوب تر و درست تر از این روش ها، نیازمند به نمونه های فراوان و در عین حال درست است زیرا این روش ها در مقابل اطلاعات نادرست، حساسیت بالایی دارند و ورود چنین داده هایی ممکن است منجر به بروز خطاهای بزرگی در نتایج به دست آمده شود. افزون بر این برای استفاده از این روش ها، متغیرها باید توزیع نرمال داشته باشند و تغییر آنها از یک رابطه خطی پیروی کند ]۹[.
رگرسیون چند متغیره در حقیقت، ارتباط بین یک سری از متغیرهای مستقل را با یک متغیر مورد نظر بیان می کنند. در صورت وجود متغیرهای مستقل x1, x2, …, xnاگر بخواهیم ارتباط خطی بین آنها و متغییر yکه وابسته به آنهاست ایجاد کنیم، رابطه زیر باید بین آنها برقرار باشد:
(۲-۱) y = a0 + a1x1 + a2x2 + … + anxn + e
که در این رابطه از مقادیر a1, a2, …, anبا عنوان ضرایب رگرسیون یاد می شود. این ضرایب، ضرایب نامشخصی بوده که در حقیقت، مسئول برآورد پارامتر وابسته هستند. در صورتی که از طرفین رابطه فوق امید ریاضی[۲۹] گرفته شود، به دلیل اینکه امید ریاضی مقدار خطای e برابر با صفر است، می توان نوشت:
(۳-۱) E(y) = a0 + a1x1 + a2x2 + … + anxn
که E(y)در حقیقت مقدار مورد انتظار تابع، تحت تأثیر و ورود مقادیرمتغیرهای x1, x2, …, xn است.
۱-۶-۵- حداقل مربعات جزئی(PLS)[30]
به منظور اشتقاق یک تابع انتقالی بر اساس متغیرهای مستقل و وابسته مورد نظر، از روش رگرسیون حداقل مربعات جزئی استفاده می گردد. این روش یکی از روش های چند متغیره است که در هنگام بروز هم خطی بین متغیرهای مستقل استفاده می شود. در این روش برای تشکیل رابطه بین متغیر وابسته و متغیرهای مستقل، متغیرهای جدیدی ساخته می شود که آنها را مؤلفه یا فاکتور می نامند. هر یک از این مؤلفه ها یک ترکیب خطی از متغیرهای مستقل اولیه می باشد. سپس از روش های رگرسیونی استاندارد برای تعیین معادلاتی که این مؤلفه ها را به متغیر وابسته ارتباط دهند استفاده می شود. شایان ذکر است که تعداد این مؤلفهها از تعداد متغیرهای مستقل اولیه کمتر بوده و همچنین بین آنها رابطه خطی وجود ندارد. در واقع روش حداقل مربعات جزئی با بکار بردن مؤلفه هایی با قدرت پیش بینی بالا که تعداد آنها از متغیرهای اولیه کمتر است، بعد مسأله را نیز کاهش می دهد. یکی از مزایای این روش به روش رگرسیون خطی چندگانه این است که می توان از متغیرهایی که از توزیع نرمال تبعیت نمی کند نیز استفاده کرد ]۱۰[.
۱-۶-۶- آنالیز اجزاء اصلی(PCA)[31]
این روش یکی از الگوهای تشخیص و شناسایی (تشخیص هویت) در یک مجموعه اطلاعات است. در این روش اطلاعات را براساس شباهت ها و تفاوت هایشان بیان می کنند. از آن جا که در اطلاعات از ابعاد بالا، نقشه و طرح خاصی را به سختی می توان در داده ها پیدا کرد. در حقیقت آنالیز اجزای اصلی ارتباط بین داده ها را کشف می کند و در جایی که نعمت نمایش گرافیکی در دسترس نیست، آنالیز اجزای اصلی یک ابزار نیرومند برای آنالیز اطلاعات است. دیگر مزیت اصلی آنالیز اجزای اصلی این است که شما یک بار این الگو را در داده ها پیدا می کنید و با کاهش تعداد ابعاد، بدون آن که مقدار زیادی از اطلاعات را از دست دهید این اطلاعات را فشرده می کنید. هدف آنالیز اجزای اصلی خلاصه کردن داده هاست و به عنوان یک وسیله دسته بندی کننده اطلاعات مورد توجه نیست، از این تکنیک در فشرده سازی تصاویر استفاده میشود. یکی از کاربردهای مطلوب آنالیز اجزای اصلی، استفاده از آن به عنوان ابزاری کمکی، در آموزش شبکه های عصبی است. معمولا قبل از آغاز آموزش شبکه های عصبی یکسری پیش پردازش برروی داده ها انجام می شود که باعث افزایش کارایی شبکه های عصبی می شود مانند: نرمال کردن داده ها و قراردادن آنها در یک فاصله مشخص مثلا بین -۱ و ۱ ]۱۱[.
۱-۶-۷- رگرسیون اجزاء اصلی (PCR)[32]
عبارتست از تجزیه و تحلیل رگرسیونی با آنالیز اجزای اصلی زمانی که ضرایب رگرسیون برآورد شده باشد. این روش برای غلبه بر مشکلاتی که متغیر های بدست امده نزدیک به راستا بودن هستند، مورد استفاده قرار می گیرد همچنین در این روش به جای استفاده از الگوهای متغیر وابسته و متغیرهای مستقل به طور مستقیم، از متغیرهای مستقل استفاده می شود. به طور معمول با بهره گرفتن از یک زیر مجموعه از اجزای اصلی در رگرسیون ساخته شده و منظم می گردد. اغلب اجزای اصلی با بالاترین واریانس انتخاب می شود، با این حال ممکن است که کمترین واریانس اجزای اصلی نیز مهم باشد حتی در برخی موارد از اهمیت بیشتری برخوردار است و بعد محاسبات پیش بینی حاصل می شود.
این روش رگراسیونی را به سه مرحله تقسیم می کنند که عبارتند از:
-
- گام اول اجزای تجزیه و تحلیل در جدول متغیر های توزیعی باشد.
-
- گام دوم برای اجرای عادی رگرسیون حداقل مربعات (رگرسیون خطی) بر روی اجزای انتخاب شده این است که عواملی که در ارتباط با متغیر وابسته هستند انتخاب شوند.
-
- در نهایت پارامترهای مدل را برای انتخاب متغیرهای توزیعی محاسبه کند ]۱۲[.
۱-۶-۸- رگرسیون چند متغیره غیر خطی(MNR)[33]
این روش یکی از تکنیک های یادگیری نظارتی و در حالتی که نتایج خروجی به صورت دوتایی[۳۴] هستند،
مورد توجه قرار می گیرد، در کل زمانی که نتایج خروجی به صورت دوتایی هستند رگرسیون خطی خیلی
کارا نیست، دراین حالت استفاده از این تکنیک مناسب تر است. نکته دیگر اینکه این روش یک تکنیک رگرسیون غیر خطی است و لزومی ندارد که داده ها حالت خطی داشته باشند. اگر بخواهیم دلیل استفاده رگرسیون لجستیک[۳۵] را بیان کنیم باید این گونه بحث کنیم در رگرسیون خطی علاوه بر اینکه نتایج خروجی باید به صورت عددی باشد، متغیرها هم باید به صورت عددی باشد بنابراین حالت هایی که به صورت مقایسه ایی هستند باید به حالت عددی تغییر شکل پیدا کنند، مثلا جنسیت افراد از حالت زن و مرد به ترتیب به حالت های ۰ و ۱ تغییر پیدا می کند. به علت اینکه خروجی متغیر بصورت دوتایی می باشد اساس رگرسیون خطی در این حالت ایراد پیدا می کند و ارزش قیدی که بر روی متغیر وابسته قرار می گیرد توسط معادله رگرسیون در نظر گرفته نمی شود. در واقع چون رگرسیون خطی معادله یک خط را ترسیم می کند نمی تواند حالت مثبت و منفی یا به عبارتی صفر و یک را در نظر بگیرد به همین دلیل برای اینکه بتوان حالت های دوتایی را هم در نظر گرفت باید شکل معادله را تغییر داد با این تغییر شکل معادله رگرسیون، احتمال اتفاق افتادن یا اتفاق نیفتادن یک واقعه را بدست می دهد. با تغییر شکل رگرسیون خطی به حالت رگرسیون لجستیک این مشکل حل می شود، با توجه به لگاریتمی بودن معادله نمودارش غیر خطی خواهد بود ]۹[..۱-۶-۹- منطق فازیفازی به معنای گنگ و مبهم و تار است. منطق فازی یک منطق ریاضی است که خیلی ها دوست دارند آن را مقابل منطق صفر و یک ریاضی قرار دهند. این منطق در سال ۱۹۶۵ توسط یک ریاضیدان ایرانی بنام دکتر لطفی زاده در آمریکا عرضه شد و در حال حاضر بعنوان روشی فوق العاده برای شناسایی و کنترل سیستمهایی که اطلاعاتی دقیقی از درون آنها در اختیار نیست، بکار می رود. در واقع امتیاز منطق و روشهای فازی زمانی مشخص می گردد که با سیستم های نسبتا فوق العاده پیچیده و با دینامیک بالا درگیر باشیم. در واقع بیان کننده این واقعیت است که لزومی ندارد که یک گزینه درست یا غلط باشد (به عبارتی صفر یا یک باشد) مثلا ممکن است گزینه ۰٫۷ درست باشد ]۱۳[.
۱-۶-۹-۱-کاربرد های منطق فازی
احتمالا راجع به یخچال های فازی یا دوربین های فیلمبرداری فازی و یا ماشین لباسشویی فازی مطالبی شنیده اید. چند کاربرد دیگر ]۱۴[ این منطق عبارتند از:
-
- ترمز های ABS و سیستم کروز
۱-۶-۱۰- شبکه های عصبی مصنوعی (ANN)
شبکههای عصبی مصنوعی یا به زبان سادهتر شبکههای عصبی، سیستمها و روش های محاسباتی نوینی برای یادگیری ماشینی، نمایش دانش و در انتها اعمال دانش به دست آمده در جهت پیشبینی پاسخ های خروجی از سامانههای پیچیده هستند. ایده اصلی این گونه شبکه ها (تا حدودی) الهام گرفته از شیوه کارکرد سیستم عصبی زیستی، برای پردازش دادهها و اطلاعات به منظور یادگیری و ایجاد دانش قرار دارد. عنصر کلیدی این ایده، ایجاد ساختارهایی جدید برای سامانه های پردازش اطلاعات است. این سیستم از شمار زیادی عناصر پردازشی فوق العاده بهم پیوسته با نام نورون[۳۶] تشکیل شده که برای حل یک مسأله با هم هماهنگ عمل میکنند و توسط سیناپسها[۳۷] (ارتباطات الکترومغناطیسی) اطلاعات را منتقل میکنند. در این شبکهها اگر یک سلول آسیب ببیند بقیه سلولها میتوانند نبود آنرا جبران کرده و نیز در بازسازی آن سهیم باشند. این شبکهها قادر به یادگیریاند، مثلا با اعمال سوزش به سلول های عصبی لامسه، سلول ها یاد میگیرند که به طرف جسم داغ نروند و با این الگوریتم سیستم میآموزد که خطای خود را اصلاح کند. یادگیری در این سیستم ها به صورت تطبیقی صورت میگیرد، یعنی با استفاده ازمثال ها وزن سیناپس ها به گونهای تغییر میکند که در صورت دادن ورودی های جدید، سیستم پاسخ درستی تولید کند. با بهره گرفتن از دانش برنامهنویسی رایانه میتوان ساختار دادهای طراحی کرد که همانند یک نورون عمل نماید. سپس با ایجاد شبکهای از این نورون های مصنوعی به هم پیوسته، ایجاد یک الگوریتم آموزشی برای شبکه و اعمال این الگوریتم به شبکه آن را آموزش داد. این شبکه ها برای تخمین[۳۸] و تقریب[۳۹] کارایی بسیار بالایی از خود نشان دادهاند. گستره کاربرد این مدلهای ریاضی بر گرفته از عملکرد مغز انسان، بسیار وسیع میباشد که به عنوان چند نمونه کوچک میتوان استفاده از این ابزار ریاضی در پردازش سیگنال های بیولوژیکی، مخابراتی و الکترونیکی تا کمک در نجوم و فضا نوردی را نام برد. اگر یک شبکه را همارز با یک گراف بدانیم، فرایند آموزش شبکه تعیین نمودن وزن هر یال و پایه اولیه خواهد بود. هدف شبکه عصبی مصنوعی ارزیابی قابل اطمینان بودن مدل QSAR است و به ارتباط غیر خطی بین متغیر های ورودی و خروجی توجه دارد.شبکه عصبی مصنوعی یک سامانه پردازشی دادههاست که از مغز انسان ایده گرفته و پردازش دادهها را به عهده پردازنده های کوچک و بسیار زیادی سپرده که به صورت شبکهای به هم پیوسته و موازی با یکدیگر رفتار میکنند تا یک مسئله را حل نمایند. در این شبکه ها به کمک دانش برنامه نویسی، ساختار دادهای طراحی میشود که میتواند همانند نورون عمل کند. که به این ساختارداده گره گفته میشود. بعد با ایجاد شبکهای بین این گرهها و اعمال یک الگوریتم آموزشی به آن، شبکه را آموزش میدهند. در این حافظه یا شبکه عصبی گرهها دارای دو حالت فعال (روشن یا ۱) و غیرفعال (خاموش یا ۰) اند و هر یال (سیناپس یا ارتباط بین گرهها) دارای یک وزن است. یال های با وزن مثبت، موجب تحریک یا فعال کردن گره غیر فعال بعدی میشوند و یال های با وزن منفی، گره متصل بعدی را غیر فعال یا مهار (در صورتی که فعال بوده باشد) میکنند. شبکه های عصبی با توانایی قابل توجه خود در استنتاج نتایج از دادهها پیچیده میتوانند در استخراج الگو ها و شناسایی گرایش های مختلفی که برای انسان ها و کامپیوتر شناسایی آنها بسیار دشوار است استفاده شوند ]۱۵[.
۱-۶-۱۰-۱- ویژگی های شبکه عصبی
یکی از مهم ترین ویژگی های شبکه عصبی مصنوعی اینست که شبکه های فوق، سیستمی برنامه ریزی شده با قواعد از پیش تعیین شده نیستند و می توانند طی فرآیندی که آموزش نامیده می شود ساختار درونی خود را به صورت تجربی به نحوی تنظیم کنند که بهترین پاسخ ممکن را برای داده های ورودی ایجاد کند. استفاده از شبکه های عصبی مصنوعی به جای روش رگرسیون خطی چندتایی در مطالعات QSAR، به خصوص هنگامی که ارتباط بین توصیف کننـده و فعالیـت مورد نظـر خطـی نبوده و یا اینکه بین آنها بر هم کنش هایی وجود داشتـه باشد باعث بهبـود مدل حاصلـه خواهــد شــد. یک شبکه عصبی شامل اجزای سازنده لایه ها و وزن ها میباشد. رفتار شبکه نیز وابسته به ارتباط بین اعضا است. شبکه عصبی مصنوعی، از مجموعهای از نورون های عصبی تشکیل میشود. مهمترین عواملی که گونهها و کاربرد های شبکههای عصبی را از یکدیگر متمایز میسازند، نوع نورون بهکارگرفته شده، چیدمان یا معماری شبکه، بازه ورودی/ خروجیها است. در معماری یک شبکه تعداد لایه ها و اتصالات بین آنها مهم است. ورودی های شبکه با نام «لایه ورودی» و خروجی های شبکه با نام «لایه خروجی» و در صورت نیاز، لایههای میان این دو «لایه پنهان» نامیده میشود. در صورتی که خروجی نورون های هر لایه به همه نورون های لایه بعدی وارد شده باشد، اتصالات را کامل مینامند، اما اغلب خروجیها بهصورت تصادفی با توزیع نرمال در نظر گرفته میشود. در حالت کلی در شبکههای عصبی سه نوع لایه نورونی وجود دارد: