پیش ­بینی امتیاز کاربر مبدا u به آیتم هدف i به صورت مجموع حاصل ضرب امتیاز حاصل از یک پیمایش تصادفی موفق در احتمال وقوع و دستیابی به آن امتیاز می­باشد.
۴-۲-۸- چگونگی محاسبه احتمال
با توجه به تعریف و توضیح ارائه شده در بخش قبلی، چگونگی محاسبه مقدار احتمال از طریق فرمول ترکیبی زیر محاسبه می­گردد.

(۲۱)

همان طور که در فرمول فوق قابل مشاهده است احتمال از حاصل ضرب سه احتمال و و حاصل می گردد که هر کدام از آنها به تفصیل در بخشهای پیشین توضیح داده شده است .
نکته قابل ذکر در فرمول فوق این است که بجای از استفاده شده است زیرا تعداد مراحلی که باید طی شود تا به گره کاربر v دسترسی پیدا شود مشخص نیست، بنابراین از پارامتر k استفاده نشده است و به عبارت دیگر مقدار k=1 فرض شده است. نکته قابل ذکر دیگر این است که نمی توان حالتی را متصور بود که در آن v=u و i=j باشد چراکه در این حالت خود کاربر مبدا u برای آیتم هدف i دارای امتیاز است و دیگر اجرای الگوریتم معنا و مفهومی ندارد.

( اینجا فقط تکه ای از متن فایل پایان نامه درج شده است. برای خرید متن کامل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. )

۴-۲-۹- چگونگی محاسبه عملی
در پیاده­سازی مدل TrustWalker نیازی به پیاده­سازی فرمول شماره ۱۹ و ۲۰ نمی ­باشد و بیان آنها تنها به جهت بیان مطالب تئوریک و ایده نهفته در مدل مد نظر قرار گرفت و برای پیاده سازی مدل، کافیست با روش های آماری و محاسبات عددی، تخمینی از فرمول شماره ۱۹ بدست آورد که با تقریب خطای بسیار ناچیزی، جواب حاصل را می توان به عنوان جواب فرمول شماره ۱۹ پذیرفت. در بخشهای آینده بیشتر در این خصوص مطالبی بیان می­گردد.
۴-۲-۱۰- شرط اتمام کلی مدل
نتایج اجرای پیمایش­های تصادفی شبکه با شروع از کاربر مبدا u و به دنبال یافتن امتیاز آیتم هدف i در واقع جواب فرمول شماره ۱۹ را تخمین می زنند و هرچه تعداد پیمایش­های تصادفی اجرا شده بیشتر باشد دقت بالاتری را به همراه خواهد داشت. نکته قابل تامل این است که چه تعداد پیمایش تصادفی باید اجرا گردد تا دقت مورد نظر را تامین کند. در مدل TrustWalker برای تعیین و حل این مسئله از واریانس کلیه نتایج حاصل از پیمایش­های تصادفی مختلف استفاده شده است.

(۲۲)

در این فرمول نتیجه اجرای iمین پیمایش تصادفی است و بیانگر میانگین پیمایش­های تصادفی اجرا شده است. T تعداد پیمایشهای تصادفی اجرا شده است، همچنین به عنوان واریانس تعداد اولین i پیمایش تصادفی است که اجرا شده است، به عنوان مثال بیانگر واریانس اولین ۵ پیمایش تصادفی اجرا شده است. با توجه به این مطلب که نتایج در بازه ]۵,۱[ می­باشد می­توان ثابت نمود[۹۵] که به یک مقدار ثابت همگرا خواهد شد بنابراین اجرای مدل TrustWalker را می­توان با توجه به شرط زیر خاتمه داد.

(۲۳)

۴-۳- بهبود و توسعه مدل TrustWalker
جهت بهبود و توسعه این مدل، تکنیکها، راهکارها و مکانیزمهای مختلف و متفاوتی مورد بررسی و آزمایش قرار گرفت تا بتوان یکی یا تعدادی از حالتهای زیر را برآورده ساخت:
میزان خطای RMSE کاهش و درصد پوشش به صورت همزمان افزایش یابد.
با حفظ میزان خطای RMSE درصد پوشش افزایش یابد.
با حفظ درصد پوشش میزان خطای RMSE کاهش یابد.
درصد پوشش برای کاربران تازه وارد افزایش یابد.
میزان خطای RMSE برای کاربران تازه وارد کاهش یابد.
در ادامه تکنیکها و متدهای مورد استفاده جهت بهبود و توسعه این مدل بیان می­گردند و در فصل آینده نتایج حاصل از پیاده­سازی و آزمایش هر یک از آنها با نتایج مدل پایه مورد مقایسه، ارزیابی و بحث و بررسی قرار می­گیرد .
۴-۳-۱- استفاده از فرمول jaccard جهت محاسبه تشابه آیتمها
ضریب تشابه Jaccard که اولین بار توسط Paul Jaccard مطرح گردید[۷۸], [۷۹] معیاری جهت مقایسه تشابه و تفاوت مجموعه داده ­ها است و به صورت تقسیم اندازه مجموعه اشتراک دو مجموعه داده مانند A و B بر اندازه مجموعه اجتماع همان دو مجموعه مطابق فرمول زیر محاسبه می­گردد.

(۲۴)

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...