شکل۴-۲٫ بخشی از نقشه‌ی شهر warsaw، اعمال شده به ابزار شبیه‌ساز ترافیکیTSF در راستای تولید پایگاه داده‌ی مسابقه‌ی ICDM 2010 که در این پایان نامه نیز استفاده شده است. در این نقشه، موقعیت ۲۰ مسیر مورد بررسی که نرخ ترافیکی مربوط به آنها در نظر گرفته شده است، بارنگ قرمز در نقشه نشان داده شده است.

در این فرمول نمایانگر ترافیک مربوط به tاُمین رکورد (tاُمین دقیقه) و نشانگر نرخ ترافیک rاُمین خیابان در طول tاُمین دقیقه است.
از آنجا که این داده مربوط به داده‌ی مسابقه است، داده ­ها بطور مشخص به دو مجموعه‌ی آموزشی[۱۶۲] و آزمایشی[۱۶۳] تقسیم شده اند. با بهره گرفتن از داده‌ی آموزشی مدل ارائه شده یادگیری و سپس روی داده ­های آزمایشی ارزیابی می­شوند. به منظور ایجاد شرایط مساوی برای مقایسه تکنیک پیشنهادی با دیگر روش­های ارائه شده روی این داده، آنالیزهای این پایان نامه نیز همین روند را دنبال کرده ­اند تا بتوان نتایج مربوطه روی داده‌ی آموزشی و آزمایشی را با دیگر روش­های مشارکت کنندگان مسابقه مقایسه کرد.

داده‌ی آموزشی

در راستای فراهم آوردن داده‌ی آموزشی ، شبیه ساز TSF، ۱۰۰ سایکل مستقل اجرا شده است که هر سایکل داده مربوط به ۱۰ ساعت (۶۰۰-دقیقه) پشت سر هم را ارائه می­دهد. از آنجا که داده ­ها در بازه های ۱ دقیقه‌ای ارائه شده اند، مجموعه‌ی داده‌ی آموزشی شامل ۶۰۰۰۰ رکورد می­باشد. همان طور که پیشتر توضیح داده شد، هر رکورد ترافیک مربوط به ۲۰ مسیر را در بر می­گیرد. بنابراین درنهایت، یک ماتریس ۶۰۰۰۰ در ۲۰ بعنوان داده آموزشی، در اختیار خواهیم داشت که برای وضوح بیشتر، به صورت برداری و نمایشی به ترتیب در فرمول (۴-۲) و شکل (۴-۲) نشان داده شده است :

(۴-۲)

داده‌ی آزمایشی

به منظور ارزیابی بهتر و طبق روال داده‌های مقایسه‌ای، مجموعه‌ی دیگری از داده ­ها شامل ۱۰۰۰ ساعت از ترافیک شبیه سازی شده، بعنوان داده‌ی آزمایشی فراهم شده است. این داده به پنجره­های ۶۰-دقیقه­ای تقسیم شده است که از هر پنجره، ۳۰ دقیقه‌ی اول آن در اختیار گذاشته شده، در حالیکه ۳۰ دقیقه‌ی بعدی، بعنوان معیار ارزیابی دقت پیش‌بینی، در نظر گرفته شده است. بطور واضح تر، با دادن نیم ساعت اول هر پنجره‌ی داده‌ی آزمایشی، هدف پیش ­بینی مجموع تعداد ماشین­ها در پریود زمانی ۱۰ تا ۲۰ دقیقه بعدی ، یعنی بازه‌ی بین دقیقه ۴۱ تا ۵۰ آن پنجره، می­باشد. بدین ترتیب بردار هدف متشکل از ۲۰ مقدار متناظر با نرخ ترافیک ۲۰ مسیر در طی ۱۰ دقیقه آینده خواهد بود. در فرمول‌های (۴-۳) و (۴-۴) به ترتیب یک پنجره تست و بردار هدف آن آورده شده است.

(۴-۳)

(۴-۴)

شایان ذکر است که پنجره‌های داده شده بعنوان داده‌ی تست، به دنبال هم نیستند و جابجا[۱۶۴] می­شوند. این بدان معناست که که این پنجره‌ها ترتیب زمانی ندارند و در واقع از پنجره­های بعدی که بدنبال پنجره‌های فعلی می‌آیند، نمی­ توان استفاده‌ای برای پیش ­بینی وضعیت ترافیکی آینده داشت. به منظور دنبال کردن بهتر ترم­های استفاده شده مربوط به داده‌های آموزشی و آزمایشی، جدول (۴-۱) آورده شده است.

جدول۴-۱٫ شرح مفاهیم و معادل ترم‌های مورد استفاده در طول متن، به­منظور ارجاع ساده‌تر وسریع‌تر به آنها. از این ترم­ها در توصیف پایگاه داده و مراحل اعمال تکنیک پیشنهادی مکرراً استفاده شده است.

ترم‌های مورد استفاده

موضوعات: بدون موضوع  لینک ثابت


فرم در حال بارگذاری ...