فایل شماره 6723 |
شکل (۱-۲): مثالی از تشخیص چهره در تصاویر مات با بهره گرفتن از روش بیان شده در [۱]
(الف) تصویر با مات شدگی شدید (ب) تصویر با مات شدگی ضعیف (ج) تصویر شفاف
ضرورت انجام تحقیق و هدف پایان نامه
همانطورکه گفته شد سیستمهای بازشناسی چهره در مورد تصاویری که مات هستند بسیارضعیف عمل می کنند. بنابراین بهسازی چنین تصاویری کمک زیادی به افزایش دقت بازشناسی آنها می کند. در این پایان نامه هدف ما طراحی و شبیهسازی روشی جهت بهسازی تصاویر چهره مات شده به منظور بهبود کارایی سیستمهای بازشناسی چهره است. با توجه به مروری که در فصل بعد برای این روشها آورده شده است ملاحظه می شود که تعداد روش های موجود برای بهسازی تصویر چهره مات شده به منظور افزایش کارایی سیستمهای بازشناسی چهره بسیار اندک است.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت nefo.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
ساختار بقیه پایان نامه به این صورت است که در فصل۲ به مروری بر روشهای موجود میپردازیم؛ در فصل۳ به معرفی روش پیشنهادی در این پایان نامه میپردازیم. در فصل۴ نیز نتایج حاصل از شبیهسازی روش پیشنهادی جهت شناسایی تابع گسترش نقطهای[۶] (PSF) مات کننده تصاویر چهره ورودی مات و رفع ماتی از آنها به منظور کاربرد در یک سیستم بازشناسی چهره بررسی می شود. فصل۵ به بیان نتیجه گیری و پیشنهاد راهکار آینده اختصاص داده شده است.
فصل دوم
مروری بر روشهای موجود
مقدمه
همانطور که گفته شد تمام شرایط محیطی مثل تغییر نور محیط یا مات شدن تصویر، در روشهای بازشناسی چهره تاثیر گذار است، لذا بررسی تاثیر روشهای رفع ماتی تصاویر ورودی در ارتقاء صحت بازشناسی الگوریتمهای بازشناسی چهره اهمیت ویژهای خواهد داشت.
ماتی تصاویر چهره وارد شده به سیستمهای بازشناسی چهره، دو مشکل مهم برای بازشناسی این تصاویر ایجاد می کند. اولا همانطور که در شکل (۲-۱) دیده می شود ویژگیهای تصویر هر شخص به طور جدی تحت تأثیر عوامل مات کننده تصویر، تغییر می کنند؛ دوما تصاویر چهره اشخاص مختلف در هنگام ماتی به هم شباهت بیشتری پیدا می کنند (شکل (۲-۱)) و بنابراین بازشناسی این تصاویر دارای خطای قابل توجهی میباشد.
شکل (۲-۱): تاثیر عوامل مات کننده برروی تصاویر چهره [۲۰]
با وجود اینکه این دو مشکل دقت سیستمهای بازشناسی چهره را به مقدار زیادی کاهش می دهند، اما روشهای اندکی جهت مقابله با این مشکلات ارائه شده و هیچ یک از آنها نتایج رضایت بخشی را در از بین بردن ماتی مربوط به تصاویر چهره خصوصا در کاربرد جهان واقعی، و افزایش دقت بازشناسی دربر نداشتهاند.
در این فصل به منظور آشنایی بیشتر با روشهای رفع ماتی از تصاویر، ابتدا در بخش ۲-۲ روشهای نوین رفع ماتی از تصاویر عمومی را بررسی میکنیم. سپس در بخش ۲-۳ به بررسی روشهای رفع ماتی از تصاویر چهره میپردازیم.
روش های رفع ماتی از تصاویر عمومی
موضوع رفع ماتی تصویر طور وسیع در حوزه هایی از قبیل پردازش تصویر، گرافیک کامپیوتری، و بینایی ماشین مطرح می شود. در حال حاضر رفع ماتی تصویر از جنبه های گوناگونی مانند نوع کاربرد تصاویر (پزشکی، صنعتی و….)؛ نوع عامل مات کننده (حرکت دوربین یا سوژه، خارج زوم دوربین بودن سوژه نسبت به دوربین، عدم تنظیم لنز دوربین، نویز، شرایط محیطی نامساعد و….)؛ کاربرد دنیای واقعی یا کامپیوتری، سرعت عملکرد، پیچیدگی محاسبات و … مورد ارزیابی قرار میگیرد.
اولین روشها در زمینه رفع ماتی از تصاویر، تکیه بر روش دیکانولوشن (عکس پیچش) [۴-۲] دارد که شامل الگوریتم لوسی– ریچاردسون [۶-۵]، فیلتر وینر[۷] [۷]، و فیلتر مبتنی بر دیکانولوشن کوچکترین مربعات[۸] میباشد.
روشهای مرسوم جهت رفع ماتی تصویر به دو دسته کلی شامل روشهای رفع ماتی متکی بر دیکانولوشن و روشهای رفع ماتی مبتنی بر دیکانولوشن کور تقسیم میشوند .
در روشهای رفع ماتی متکی بر دیکانولوشن فرض بر آن است که ما عامل مات کننده و مشخصات آن را میشناسیم. حال این عامل که با تصویر اصلی کانوالو شده را از طریق عکس عمل کانولوشن یعنی دیکانولوشن، حذف میکنیم. از جمله این روشها می شود به روش فیلتر وینر و فیلتر حذف نویزگوسی شعاعی اشاره کرد.
در روشهای رفع ماتی متکی بر دیکانولوشن کور، عامل مات کننده مشخص نیست و ما بر اساس یک الگوریتم یادگیری سعی میکنیم به تخمینی از این عامل برسیم. مهم ترین نقص این روشها وابستگی زیاد کیفیت رفع ماتی به تخمین کرنل مات کننده تصویر میباشد. در امر یادگیری پارامترها، جهت تخمین کرنل مات کننده دو نوع یادگیری تحت نظارت و بدون نظارت وجود دارد. در یادگیری تحت نظارت ما اطلاعاتی از قبیل نوع عامل مات کننده، مقدار واریانس و یا میانگین عامل مات کننده، اندازه کرنل عامل مات کننده و… در مورد عامل مات کننده داریم. اما در یادگیری بدون نظارت فرض میکنیم هیچ گونه اطلاعاتی در مورد عامل مات کننده وجود ندارد و قرار است هرگونه تصویری که به الگوریتم داده شود شفاف شود.
یکی از مشکلات موجود در امر رفع ماتی تصاویر، مبحث رفع ماتی تصاویر جهان واقعی است که ممکن است در آنِ واحد تصویر بر اساس چندین عامل مات کننده (مثلا نویز و حرکت و عوامل محیطی)، مات شود که برای برطرف کردن آنها باید معادلاتی غیر خطی و پیچیده حل و مورد بررسی قرار گیرد. از این رو برای اجتناب از این کار، بیشتر الگوریتمهایی که مورد بررسی قرار میگیرند دارای کاربردی محدود در زمینهای خاص میباشند. البته راه حلهایی برای این کاربرد ارائه شده که در آنها استفاده از شبکه عصبی نقش مهمی را جهت انجام یادگیری بر عهده دارد[۸].
در [۹] جهت انجام یادگیری تحت نظارت برای تخمین کرنل مات کننده، مجموعه ای از تصاویر شفاف و تصاویر مات شده متناظر با آنها جمع آوری شده و هر زوج تصویر مات و شفاف به چند قسمت تقسیم میشوند و درون پنجرههایی ذخیره میشوند. سپس در مرحله آموزش، طبق معیار بیزین[۹] دو ماتریس L,R (مربوط به سمت راست و چپ هر تصویر) از آموزش الگوریتم بدست می آید، که توسط این دو ماتریس یک نگاشت در چهار چوب فرضی توسط رگرسیون ماتریس از فضای مات به فضای شفاف جهت رفع ماتی تصویر صورت میپذیرد. سپس به منظور تقویت جزئیات و لبههای تصویر رفع ماتی شده توسط روش رگرسیون ماتریس، روش گرادیان تکاملی برروی تصویر اعمال شده و در نهایت تصویری شفاف حاصل می شود. البته ما در این پایان نامه پس از شبیهسازی این روش به این نتیجه رسیدیم که کیفیت تصاویر بهسازی شده توسط این روش تا حد زیادی به صحت تخمین PSF مات کننده تصویر بستگی دارد. همچنین مدت زمان لازم برای رفع ماتی از تصاویر توسط این روش نسبتا طولانی است (به طور متوسط بیش از ۶۰ ثانیه برای هر تصویر چهره با ابعاد ۹۲×۱۱۲ لازم است).
مرجع [۱۰] سعی در بهبود کیفیت تصاویر رادیولوژی مات شده در هنگام تصویربرداری می پردازد. در این مرجع از مدل میانگین متحرک خودکار[۱۰] (ARMA)جهت انجام دیکانولوشن برروی تصاویر مات شده به صورت غیر خطی، و همچنین از یک شبکه عصبی[۱۱](NN) جهت آموزش داده ها با استفاده ازالگوریتم بهینهسازی ازدحام ذرات[۱۲] که کلونی زنبورهای مصنوعی[۱۳] (ABC) نامیده می شود، استفاده می شود. سپس به پیادهسازی الگوریتم پیشنهادی خود برروی آرایه دریچهای برنامه پذیر میدانی[۱۴] (FPGA) می پردازد.
از مجموعه بررسیها در عرصه رفع ماتی از تصاویر عمومی، به اهمیت این امر در موضوعات پردازش تصویر و جایگاه آن به عنوان یک سیستم پیش پردازش جدایی ناپذیر در بیشتر کاربردهای دنیای مجازی یا واقعی پی برده می شود. در ادامه به یکی از کاربردهای این سیستم پیش پردازش در موضوع بازشناسی چهره اشاره میکنیم.
روشهای رفع ماتی از تصاویر چهره در کاربرد بازشناسی چهره
همانطورکه در قسمت های قبل نیز اشاره شد مات بودن تصویر، در عملکرد روشهای بازشناسی چهره تاثیرگذار است و الگوریتمهای مختلف تاثیرپذیریهای مختلفی دارند. لذا بررسی روشهای رفع ماتی تصاویر ورودی به الگوریتمهای بازشناسی چهره به منظور ارتقا صحت بازشناسی اهمیت ویژهای خواهد داشت.
از بررسیهای انجام شده به این نتیجه رسیدیم که برای مقابله با تاثیر مخرب ماتی تصویر برروی بازده سیستمهای بازشناسی چهره پنج روش کلی وجود دارد که این پنج روش عبارتاند از:
الف) بهسازی تک تصویر بدون استفاده از اطلاعات مرحله آموزش:
برای مثال، در [۱۱] دو عامل ماتی بر اثر حرکت و عامل اتمسفری را به عنوان مهمترین عوامل تاثیرگذار بر عملکرد سیستمهای بازشناسی چهره به صورت بلادرنگ، معرفی می کند. در این مرجع برای از بین بردن اثر عوامل مات کننده به ارائه روش تخمین خودکار عامل ماتی بر اثر حرکت و عامل ماتی اتمسفری، به صورت همزمان با بهره گرفتن از یک خط لوله مشترک در کاربرد بلادرنگ بازشناسی چهره می پردازد. در این مرجع برای تخمین پارامترهای کرنل ماتی بر اثر حرکت و تخمین تابع گسترش نقطهای مربوط به عامل مخرب اتمسفر از یک تصویر ورودی استفاده می کند و سپس با بهره گرفتن از روشهایی مثل فیلتر وینر جهت حذف اثر مخرب این عوامل اقدام می شود. اساس کار تخمین خودکار کرنل ماتی بر اثر حرکت در این مرجع بر پایه این نکته است که اکثر توابع گسترش مربوط به تصاویر مات دارای صفرهای متناوب در حوزه فرکانس میباشند که با توجه به [۱۲] از این خاصیت میتوان جهت تخمین میزان طول و زاویه کرنل مات کننده استفاده کرد. البته باید به این نکته توجه داشت که وجود نویز همراه با تصویر روی کارایی این روش اثر دارد و در واقع باید یک تبادلی بین میزان سرعت در اجرا و پیچیدگی محاسبات و تحمل پذیری در برابر عوامل ناخواسته مثل نویز، توسط طراح صورت پذیرد.
در [۱۳]، چان و وانگ با بهره گرفتن از روش تنظیم انحراف مجموع، پس از یافتن PSF مات کننده تصویر به بهسازی آن میپردازند. سایر روشهای ارائه شده در زمینه بهسازی تک تصویر، به یافتن PSF مات کننده تصویر از روی پروفایل شدت روشنایی تصویر در اطراف لبهها میپردازند. به طور مثال در [۱۴] و [۱۵]، PSF مات کننده تصویر از روی شدت روشنایی و با بهره گرفتن از تغییرات مقیاس گوسی شناسایی می شود. در [۱۶] و [۱۷] با بهره گرفتن از ضرایب تبدیل موجک، در [۱۸] از مجموع مشتقهای تصویر، و در [۱۹] از روی مقدار آلفا () به نمایندگی از شفافیت نقاط مرزی اشیا، PSF مات کننده تصویر شناسایی می شود.
به خاطر اینکه روشهای ذکر شده به اندازه کافی از اطلاعات قبلی در مورد شناسایی PSF مات کننده تصویر استفاده نمیکنند، در شناسایی این تابع تا حدی دچار خطا شده و در نتیجه کیفیت تصاویر بهسازی شده توسط این روشها، در بیشتر موارد پایین میباشد [۲۰]. در [۲۱] با آزمایش این روشها در سیستمهای بازشناسی تصویر، این نتیجه به دست آمده که استفاده از روشهای نام برده شده به عنوان یک سیستم پیش پردازش در سیستمهای بازشناسی تصویر مناسب نمی باشد.
ب) استخراج ویژگیهای ثابت و غیر حساس به عامل مات کننده جهت بازشناسی تصاویر مات شده:
در [۲۲] گوپالان و همکارانش ابتدا به ایجاد فضای ویژگی بر پایه اطلاعات مربوط به ویژگیهای ثابت و غیر حساس به عامل مات کننده، از روی شدت روشنایی تصاویر میپردازند. سپس با بهره گرفتن از روش منیفلد گراسمن[۱۵]، به بازشناسی تصاویر از روی نمونههای مات میپردازند. اگرچه این روش نسبت به روشهای بررسی شده دارای نتایج قابل قبولتری است، اما ویژگیهای استخراج شده از روی شدت روشنایی پیکسلها برای داشتن یک سیستم بازشناسی قدرتمند خصوصا در شرایط نویزی مناسب نمی باشد [۲۳].
در [۲۳] سان و همکارانش به طراحی یک سیستم بازشناسی چهره بر اساس استخراج ویژگی از روی تصاویر مات، با بهره گرفتن از انجام تبدیل STFT از روی تصاویر میپردازند. اما با وجود بازده نسبتا بالای این روش در بازشناسی تصاویر مات شده (بازده بیش از ۹۰ درصد در شرایط بدون نویز)، بازهم این روش در شرایط نویزی خوب عمل نمیکند و همچنین با توجه به استفاده از تبدیل محلی STFT به عنوان سیستم استخراج کننده ویژگی سرعت اجرای الگوریتم پایین است.
در [۲۴] چان و همکارانش ابتدا با بهره گرفتن از ایجاد فضای ویژگی براساس اطلاعات متشکل از چهارچوب چند مقیاسی[۱۶] کوانتیزه کننده فاز به صورت محلی[۱۷] (MLPQ)، و همچنین چهار چوبی دیگر شامل اطلاعات الگوی دودویی محلی چند مقیاسی[۱۸] (MLBP) از روی تصاویر میپردازند. سپس با بهره گرفتن از روش تجزیه و تحلیل جدا کننده تابع [۱۹] (KDA) به تلفیق ویژگیهای استخراج شده توسط دو روش پرداخته و بر اساس اطلاعات این فضای ویژگی به بازشناسی چهره میپردازند. با وجود اینکه در این مرجع آزمایشات گستردهای برروی پنج پایگاه داده مختلف صورت گرفته، اما نه در مورد دقت بازشناسی تصاویر مات در شرایط نویزی، و نه در مورد سرعت اجرای الگوریتم اطلاعاتی منتشر نشده است.
تخمین PSF مات کننده تصاویر در یک سیستم بازشناسی مورد نظر و ایجاد پایگاه داده از روی تصاویر مات شده با همان PSF:
از جمله این روشها میتوان به روش ارائه شده در [۲۵] که توسط استیون و همکارانش ارائه شد، اشاره کرد. طی این روش ابتدا مجموعه ای از تصاویر مربوط به افرادی که بعدا باید تصویر آنها توسط سیستم بازشناسی چهره شناسایی شوند، تهیه و ذخیره می شود. سپس از روی هر تصویر نمونههایی که به صورت مصنوعی مات شده اند، ایجاد و به عنوان تصاویر معرف هر شخص در نظر گرفته میشوند. حال تصویر چهره ورودی ناشناس، با هریک از تصاویر ایجاد شده مقایسه و بازشناسی انجام می شود. اگر چه این روش می تواند در مقابل تغییرات ایجاد شده در تصاویر چهره توسط عامل مات کننده به خوبی مقاومت کند، اما در خصوص مساله افزایش شباهت تصاویر چهره اشخاص مختلف در هنگام ماتی به کلی بی اثر است. به همین دلیل، نتوانسته بازده سیستم بازشناسی چهره را به صورت قابل توجهی افزایش دهد.
د) افزایش ویژگیها به صورت مستقیم:
طی روش ارائه شده در [۲۶] با بهره گرفتن از تصویربرداری چندگانه از صحنههای مشابه و مقایسه آنها با یکدیگر، به شناسایی PSF مات کننده تصویر پرداخته می شود؛ اما باید توجه داشت که پیادهسازی این روش در خصوص سیستمهای بازشناسی تصویر، کاربرد این سیستمها را محدود می کند.
ه) رفع ماتی و افزایش تباین تصاویر با بهره گرفتن از اطلاعات مرحله آموزش:
همانطور که ملاحظه میکنید بیشتر روشهای بیان شده به اندازه کافی از اطلاعات قبلی در مورد شناسایی PSF تصویر استفاده نمیکنند. از طرفی تشخیص دادن لبههای مات شده تصویر از روی پروفایل شدت روشنایی آن به منظور یافتن PSF مات کننده تصویر(به ویژه در شرایط نویزی)، مشکل و دارای خطای زیاد است؛ در نتیجه PSF مات کننده تصویر، به خوبی شناسایی نشده و بنابراین، کیفیت تصاویر بهسازی شده توسط این روشها، در بیشتر موارد پایین میباشد.
در [۲۰] یکی از روشهای جدید و دارای نتایج نسبتا رضایت بخش جهت بازشناسی تصاویر چهره مات، که استنتاج بهسازی تصاویر چهره[۲۰] (FADEIN) نام دارد، معرفی شده است. در این روش محققان به شناسایی PSF مات کننده تصاویر چهره با بهره گرفتن از فراگیری مدل آماری مبتنی بر تغییرات ناشی از تاثیر ماتی برروی تصاویر چهره، پرداختهاند. ما در این پایان نامه، روش پیشنهادی خود را با روش FADEIN مقایسه میکنیم.
در این پایان نامه برای مقابله با مشکلات موجود در روشهای مذکور، از دانش قبلی برای شناسایی PSF مربوط به عامل مات کننده تصاویر چهره استفاده میکنیم. در روش پیشنهادی ابتدا در مرحله آموزش، جهت شناسایی مشخصات PSF، مجموعه ای از تصاویر چهره را با بهره گرفتن از چند PSF مشخص و استاندارد، به صورت مصنوعی مات کرده و پس از نگاشت این تصاویر به فضای ویژگی، به استخراج ویژگی از این تصاویر در این فضا جهت آموزش و یادگیری وزنهای یک شبکه عصبی MLP میپردازیم. حال در مرحله آزمایش، تصویر چهره مات ورودی که دارای PSF نامشخص و تصادفی میباشد را به فضای ویژگی بیان شده در مرحله آموزش نگاشت داده و پس از استخراج ویژگی، آنها را به عنوان ورودی به شبکه عصبی آموزش داده شده در مرحله قبل، اعمال میکنیم. با بهره گرفتن از این شبکه، مشخصات PSF مات کننده تصویر ورودی شناسایی می شود.
از نکات بارز و قابل توجه روش پیشنهادی در این پایان نامه، افزایش همزمان سرعت و دقت شناسایی مشخصات PSF مات کننده تصاویر چهره، نسبت به سایر روشهای نوین ارائه شده در این زمینه میباشد، که این خود به دلیل استفاده از روشی خاص جهت استخراج ویژگی و همچنین استفاده از شبکه عصبی جهت شناسایی این تابع میباشد.
فصل سوم
روش پیشنهادی
مقدمه
فرم در حال بارگذاری ...
[یکشنبه 1401-04-05] [ 11:41:00 ب.ظ ]
|