فایل شماره 5204 |
شکل۴-۲٫ بخشی از نقشهی شهر warsaw، اعمال شده به ابزار شبیهساز ترافیکیTSF در راستای تولید پایگاه دادهی مسابقهی ICDM 2010 که در این پایان نامه نیز استفاده شده است. در این نقشه، موقعیت ۲۰ مسیر مورد بررسی که نرخ ترافیکی مربوط به آنها در نظر گرفته شده است، بارنگ قرمز در نقشه نشان داده شده است.
در این فرمول نمایانگر ترافیک مربوط به tاُمین رکورد (tاُمین دقیقه) و نشانگر نرخ ترافیک rاُمین خیابان در طول tاُمین دقیقه است.
از آنجا که این داده مربوط به دادهی مسابقه است، داده ها بطور مشخص به دو مجموعهی آموزشی[۱۶۲] و آزمایشی[۱۶۳] تقسیم شده اند. با بهره گرفتن از دادهی آموزشی مدل ارائه شده یادگیری و سپس روی داده های آزمایشی ارزیابی میشوند. به منظور ایجاد شرایط مساوی برای مقایسه تکنیک پیشنهادی با دیگر روشهای ارائه شده روی این داده، آنالیزهای این پایان نامه نیز همین روند را دنبال کرده اند تا بتوان نتایج مربوطه روی دادهی آموزشی و آزمایشی را با دیگر روشهای مشارکت کنندگان مسابقه مقایسه کرد.
دادهی آموزشی
در راستای فراهم آوردن دادهی آموزشی ، شبیه ساز TSF، ۱۰۰ سایکل مستقل اجرا شده است که هر سایکل داده مربوط به ۱۰ ساعت (۶۰۰-دقیقه) پشت سر هم را ارائه میدهد. از آنجا که داده ها در بازه های ۱ دقیقهای ارائه شده اند، مجموعهی دادهی آموزشی شامل ۶۰۰۰۰ رکورد میباشد. همان طور که پیشتر توضیح داده شد، هر رکورد ترافیک مربوط به ۲۰ مسیر را در بر میگیرد. بنابراین درنهایت، یک ماتریس ۶۰۰۰۰ در ۲۰ بعنوان داده آموزشی، در اختیار خواهیم داشت که برای وضوح بیشتر، به صورت برداری و نمایشی به ترتیب در فرمول (۴-۲) و شکل (۴-۲) نشان داده شده است :
(۴-۲)
دادهی آزمایشی
به منظور ارزیابی بهتر و طبق روال دادههای مقایسهای، مجموعهی دیگری از داده ها شامل ۱۰۰۰ ساعت از ترافیک شبیه سازی شده، بعنوان دادهی آزمایشی فراهم شده است. این داده به پنجرههای ۶۰-دقیقهای تقسیم شده است که از هر پنجره، ۳۰ دقیقهی اول آن در اختیار گذاشته شده، در حالیکه ۳۰ دقیقهی بعدی، بعنوان معیار ارزیابی دقت پیشبینی، در نظر گرفته شده است. بطور واضح تر، با دادن نیم ساعت اول هر پنجرهی دادهی آزمایشی، هدف پیش بینی مجموع تعداد ماشینها در پریود زمانی ۱۰ تا ۲۰ دقیقه بعدی ، یعنی بازهی بین دقیقه ۴۱ تا ۵۰ آن پنجره، میباشد. بدین ترتیب بردار هدف متشکل از ۲۰ مقدار متناظر با نرخ ترافیک ۲۰ مسیر در طی ۱۰ دقیقه آینده خواهد بود. در فرمولهای (۴-۳) و (۴-۴) به ترتیب یک پنجره تست و بردار هدف آن آورده شده است.
(۴-۳)
(۴-۴)
شایان ذکر است که پنجرههای داده شده بعنوان دادهی تست، به دنبال هم نیستند و جابجا[۱۶۴] میشوند. این بدان معناست که که این پنجرهها ترتیب زمانی ندارند و در واقع از پنجرههای بعدی که بدنبال پنجرههای فعلی میآیند، نمی توان استفادهای برای پیش بینی وضعیت ترافیکی آینده داشت. به منظور دنبال کردن بهتر ترمهای استفاده شده مربوط به دادههای آموزشی و آزمایشی، جدول (۴-۱) آورده شده است.
جدول۴-۱٫ شرح مفاهیم و معادل ترمهای مورد استفاده در طول متن، بهمنظور ارجاع سادهتر وسریعتر به آنها. از این ترمها در توصیف پایگاه داده و مراحل اعمال تکنیک پیشنهادی مکرراً استفاده شده است.
ترمهای مورد استفاده
فرم در حال بارگذاری ...
[یکشنبه 1401-04-05] [ 08:25:00 ب.ظ ]
|