فایل شماره 5698 |
L1 = {large 1-itemsets}
اقلام با بیشترین فراوانی را محاسبه میکند.
= database D;
For (k=2; Lk-1 ≠ ; k++) do begin
موجودیتهای خالی را حذف میکند.
پشتیبان را محاسبه میکند.
Ckهای جدید را مطابق الگوریتم بیان شده تولید میکند.
مقداردهی اولیه پایگاه داده موجود
یک انبارهی جدید ایجاد میکند.
فقط آنهایی که از حداقل پشتیبان بزرگتر یا مساویند را در Lk قرار میدهد.
Ck = apriori-gen(Lk-1);
for all entries t do begin
for all candidates c Ct do
c.count++;
end
end
Lk = {c Ck|c.count minsup}
end
Answer = UkLk ;
شکل ۳- ۶: الگوریتم AprioriTid
مزایای الگوریتم: از مزایای عمده این روش این است که در فازهای آخر اندازه بسیار کوچکتر از کل اندازه پایگاه داده شده و باعث صرفه جویی در زمان میشود. این الگوریتم از نظر عملکرد نیز بر الگوریتمهای SETM و AIS برتری دارد. مشکلی که ممکن است وجود داشته باشد مدیریت حافظه است و دیده میشود که این الگوریتم در فازهای انتهایی ( اندازه کوچکتر میشود ) عملکرد بهتری نسبت به الگوریتم Apriori دارد.
معایب الگوریتم: در فازهای اولیه های تولید شده بزرگ بوده و فضای زیادی اشغال میکنند. بنابراین مدت زمانی معادل زمان الگوریتم Apriori را نیازمند است. اگر فضای اشغال شده بیشتر از حافظه در دسترس باشد، هزینه اضافهای را نیز در بر خواهد داشت.
۳-۵- جمعبندی
در این فصل، ابتدا شرح مختصری بر دادهکاوی توزیع شده داده شد. همانطور که گفته شد این تکنولوژی با مشکلات پیچیدهای، مانند منابع دادهای بزرگ، مشکلات انتقال داده، ترکیب دادهها، و غیره روبرو است. سپس عاملها و سیستمهای چند عامله، و مزایای بهرهگیری ازین تکنولوژی در دادهکاوی و دادهکاوی توزیع شده مورد بررسی قرار گرفت. در نهایت الگوریتمهای مطرح در حوزه کشف قوانین انجمنی معرفی شدند. در فصل بعد، محاسبات و یافتههای تحقیق ارائه خواهند شد.
فصل چهارم محاسبات و یافتههای تحقیق
۴-۱- مقدمه
در این فصل قصد داریم، معماری پیشنهادی برای داده کاوی برپایهی سیستمهای چند عامله را ارائه کرده و به شرح مختصری از داده کاوی توزیع شده بپردازیم.
مباحث تحقیقاتی باز بسیاری در حوزهی دادهکاوی بر پایهی عامل وجود دارد. در تاسیس یک زیرساخت دادهکاوی سازمانی بر پایهی عامل، ممکن است یک نفر بر روی تکنیکهای طراحی و تجزیه و تحلیل سیستم بررسی اجتماع محور و سازمانی برای سیستمهای بر پایهی عامل در مقیاس بالا مطالعه کند. به همان نسبت، راه حلهایی برای یکپارچهسازی برنامهها بر پایهی سرویس عامل، آمادهسازی داده توزیع شده، مشارکت عامل توزیع شده و محاسبات عامل موازی باید درنظر گرفته شود. در بسیاری از حالات دادهکاوی، افراد باید بر روی الگوریتمهایی که بتوانند با تغییرات پویای داده و درخواستهای پویای کاربر سازگاری پیدا کنند، مطالعه و بررسی انجام دهند. الگوریتمهای دادهکاوی سازگارپذیر و اتوماتیک باید مورد بررسی قرار گیرند. در ادامه لیستی از برخی از مباحث باز این حوزه آورده شده است:
کاوش و مدلسازی فعالیت
دادهکاوی سازمانی بر پایهی عامل
زیرساخت دادهکاوی بر پایهی عامل
مدیریت پروژه و فرایند کاوش بر پایهی عامل
دادهکاوی توزیع شده بر پایهی عامل
یادگیری توزیع شده بر پایهی عامل
محاسبات گرید بر پایهی عامل
دادهکاوی تعاملی بر پایهی عامل
دادهکاوی موازی بر پایهی عامل
کاوش وب برپایهی عامل
مدیریت دانش در دادهکاوی توزیع شده بر پایهی عامل
دادهکاوی همیاری انسان با عامل
عاملهای شبکه در کشف دانش و سرویسدهی توزیع شده
فرم در حال بارگذاری ...
[یکشنبه 1401-04-05] [ 09:00:00 ب.ظ ]
|