روش سوم تخمین مدل، که در این تحقیق نیز مورد استفاده قرار گرفته است ، تخمین بر اساس «داده های پانل[۶۲]» است. در این روش یک سری واحدهای مقطعی ( مثلاً شرکت ها ) در طی چند سال مورد توجه قرار می گیرند. با کمک این روش که در مطالعات سال های اخیر نیز زیاد استفاده شده است تعداد مشاهدات تا حد مطلوب افزایش می یابد. با توجه به اینکه مشاهده های ادغام شده باعث تغییرپذیری بالاتر، هم خطی چندگانه کمتر میان متغیرهای توضیحی، درجه آزادی بیشتر و کارآیی بالاتر تخمین زن ها می شود، مطالعات پانل نسبت به مطالعات مقطعی و سری زمانی دارای مزیت است (بالتاجی[۶۳]، ۱۹۹۵، ص ۶-۳). در حالت کلی مدل زیر نشان دهنده یک مدل با داده های پانل می باشد:
که در آن نشانگر واحدهای مقطعی (مثلا شرکت ها) و نشانگر زمان ( مثلاً سال ) است. متغیر وابسته را برای امین واحد مقطعی در سال نشان می دهد و نیز امین متغیر توضیحی غیرتصادفی برای امین واحد مقطعی ( شرکت ) در سال ام است. جمله اخلال بوده که فرض می شود دارای میانگین صفر ( ) و واریانس ثابت ( ) است.
(( اینجا فقط تکه ای از متن درج شده است. برای خرید متن کامل فایل پایان نامه با فرمت ورد می توانید به سایت feko.ir مراجعه نمایید و کلمه کلیدی مورد نظرتان را جستجو نمایید. ))
پارامترهای مدل می باشد که واکنش متغیر وابسته نسبت به تغییرات امین متغیر توضیحی در امین مقطع ( شرکت ) و امین زمان ( سال ) را اندازه گیری می کند. برای تخمین مدل بر اساس داده های پانل، روش های مختلفی همچون روش اثرات ثابت[۶۴] و روش اثرات تصادفی[۶۵] وجود دارد که بر حسب مورد، کاربرد خواهند داشت.
۳-۶-۱-۱) روش اثراث ثابت:
در روش اثرات ثابت فرض بر این است که ضرایب مربوط به متغیرهای توضیحی ( شیب ها ) ثابت هستند و اختلافات بین واحدها ( شرکت ها ) را می توان به صورت تفاوت عرض از مبداء نشان داد. در این حالت اگر عرض از مبداء تنها برای واحدهای مقطعی ( شرکت ها ) مختلف، متفاوت باشد اصلاحاً روش اثرات ثابت یکطرفه[۶۶] نامیده شده و مدل آن بصورت زیر می باشد:
و اگر عرض از مبداء هم مابین مقاطع ( شرکت ها ) و هم مابین دوره ( سال ) ها متفاوت باشد روش اثرات ثابت دوطرفه[۶۷] نامیده می شود و مدل آن بصورت زیر خواهد بود:
در مدل های فوق متغیری است که برای واحدهای مقطعی ( شرکت ها ) متفاوت اما در طول زمان ( سال ) ثابت می باشد و متغیری است که برای تمام واحدهای مقطعی ( شرکت ها ) در زمان مشابه یکسان بوده اما در طول زمان تغییر می کند. برای برآورد روش اثرات ثابت از مدل حداقل مربعات متغیر مجازی[۶۸] (LSDV) استفاده می شود. مدل اخیر یک مدل رگرسیونی کلاسیک بوده و هیچ شرط جدیدی برای تجزیه و تحلیل آن لازم نیست و از طریق روش حداقل مربعات معمولی[۶۹] قابل برآورد می باشد.
۳-۶-۱-۲ ) روش اثرات تصادفی:
مدل های اثرات ثابت تنها درصورتی منطقی خواهد بود که ما اطمینان داشته باشیم که اختلاف بین مقاطع ( شرکت ها ) را می توان به صورت انتقال تابع رگرسیون ( تفاوت عرض از مبداء ) نشان داد، در حالیکه ما همیشه از وجود این موضوع مطمئن نیستیم. برای رفع این مشکل روشی پیشنهاد شده است که به مدل اجزاء خطا[۷۰] یا اثرات تصادفی معروف است. این روش فرض می کند که جزء ثابت مشخص کننده مقاطع مختلف به صورت تصادفی بین واحدها و مقاطع توزیع شده است. بنابراین مدل اثرات تصادفی را می توان بصورت زیر تعریف کرد:
که در آن یک جمله خطای تصادفی با میانگین صفر و واریانس می باشد. بنابراین در مدل اثرات تصادفی جزء خطا از دو بخش تشکیل شده است؛ یکی که جزء خطا مقطع ( انحراف از میانگین عرض از مبداء مقاطع مختلف ) می باشد، و دیگری که جزء خطا ترکیبی مقطع و سری زمانی است. با توجه به اینکه در این حالت واریانس های مربوط به مقاطع مختلف با هم یکسان نیستند لذا مدل دچار ناهمسانی واریانس بوده و از روش حداقل مربعات تعمیم یافته[۷۱] (GLS) جهت برآورد مدل استفاده می شود.
۳-۶-۱-۳ )آزمون چاو[۷۲] یا F لیمر:
در بررسی داده های مقطعی و سری های زمانی، اگر ضرایب اثرات مقطعی و اثرات زمانی معنی دار نشود، می توان داده ها را با یکدیگر ترکیب کرده و به وسیله یک رگرسیون حداقل مربعات معمولی تخمین بزنیم. از آنجایی که در اکثر داده های ترکیبی اغلب ضرایب مقاطع یا سری های زمانی معنی دار هستند این مدل که به مدل رگرسیون ترکیبی[۷۳] معروف است کمتر مورد استفاده قرار می گیرد (یافی[۷۴]، ۲۰۰۳). لذا برای اینکه بتوان مشخص نمود که آیا داده های پانل جهت تخمین تابع رگرسیون جامعه کارآمدتر خواهد بود یا نه، فرضیه ای را آزمون می کنیم که در آن کلیه عبارات ثابت برآورد با یکدیگر برابر هستند. فرضیه صفر این آزمون که به آزمون چاو یا F لیمر معروف است بصورت زیر می باشد:
برای آزمون فرضیه مذکور از آماره F بصورت زیر استفاده می شود:
که در آن N برابر با تعداد واحدهای مقطعی ( شرکت ها )، T طول دوره مورد نظر( تعداد سال ها )، K تعداد متغیرهای توضیحی، RRSS مجذور پسماندهای حاصل از برآورد مقید رگرسیون بصورت حداقل مربعات متغیر مجازی و URSS مجذور پسماندهای حاصل از برآورد نامقید رگرسیون بصورت حداقل مربعات معمولی می باشد. در این آزمون فرضیه یعنی یکسان بودن عرض از مبداء ها در مقابل فرضیه یعنی ناهمسانی عرض از مبداء ها قرار می گیرد. در صورتی که فرضیه پذیرفته شود به معنی یکسان بودن شیب ها برای مقاطع مختلف بوده و قابلیت ترکیب شدن داده ها و استفاده از مدل رگرسیون ترکیبی مورد تأیید آماری قرار می گیرد. اما در صورت رد فرضیه روش داده های پانل پذیرفته می شود و می توان از روش داده های پانل استفاده کرد.
۳-۶-۱-۴ ) آزمون هاسمن[۷۵]:
پس از تایید آماری استفاده از روش داده های پانل توسط آزمون چاو، به منظور اینکه مشخص گردد کدام روش (اثرات ثابت و یا اثرات تصادفی) جهت برآورد مناسب تر است (تشخیص ثابت یا تصادفی بودن تفاوت های واحدهای مقطعی) از آزمون هاسمن استفاده می شود. در روش اثرات تصادفی بار متغیرهای حذف شده روی جمله خطا قرار می گیرند، اما این مشروط بر آن است که بین متغیرهای توضیحی و مؤلفه خطای مقطعی همبستگی وجود نداشته باشد. آزمون هاسمن وجود این همبستگی را بررسی می کند. این آزمون مبتنی بر این فرض اولیه است که در صورت وجود همبستگی، روش اثرات ثابت سازگار و روش اثرات تصادفی ناسازگار است. اگر تخمین زن روش اثرات تصادفی و تخمین زن روش اثرات تصادفی باشد آماره این آزمون که دارای توزیع کای-دو با درجه آزادی برابر با تعداد متغیرهای توضیحی است بصورت زیر قابل تعریف می باشد:
فرضیه صفر در آزمون هاسمن به صورت زیر خواهد بود:
فرضیه صفر به این معنی است که ارتباطی بین جزء خطا مربوط به عرض از مبدأ ( انحراف از میانگین عرض از مبداء شرکت ها ) و متغیرهای توضیحی وجود ندارد و آن ها از یکدیگر مستقل هستند. در حالی که فرضیه مقابل به این معنی است که بین جزء خطا مزبور و متغیرهای توضیحی همبستگی وجود دارد. از آنجایی که به هنگام وجود همبستگی بین اجزاء خطا و متغیر توضیحی با مشکل تورش و ناسازگاری مواجه می شویم، بنابراین بهتر است در صورت پذیرفته شدن (رد ) از روش اثرات ثابت استفاده کنیم. هنگامی که بین اجزاء خطا و متغیر توضیحی همبستگی وجود نداشته باشد ( قبول )، هر دو روش اثرات ثابت و اثرات تصادفی سازگار هستند ولی روش اثرات ثابت ناکارآ بوده و بایستی از روش اثرات تصادفی استفاده شود (بالتاجی، ۱۹۹۵، ص ۷۳-۶۸ ).
۳-۶-۲ )آزمون معنی دار بودن مدل
برای بررسی معنی دار بودن مدل رگرسیون از آماره F استفاده شده است. فرضیه صفر در آزمون F به صورت زیر خواهد بود:
که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد:
برای تصمیم گیری در مورد پذیرش یا رد فرضیه صفر، آماره F به دست آمده با F جدول که با درجات آزادی K-1 و N-K در سطح خطای ( ) ۵% محاسبه شده، مقایسه می شود، اگر F محاسبه شده بیشتر از F جدول باشد ( ) مقدار عددی تابع آزمون در ناحیه بحرانی قرار گرفته و فرض صفر ( ) رد می شود. در این حالت با ضریب اطمینان ۹۵% کل مدل معنی دار خواهد بود. در صورتی که مقدار F محاسبه شده کمتر از F جدول باشد فرض پذیرفته شده و معنی داری مدل در سطح اطمینان ۹۵% مورد تأیید قرار نمی گیرد.
۳-۶-۳ ) آزمون معنی دار بودن متغیرهای تحقیق
برای بررسی معنی دار بودن ضرایب متغیرهای توضیحی در هر مدل از آماره t استفاده شده است. فرضیه صفر در آزمون t به صورت زیر خواهد بود:
که بوسیله آماره زیر صحت آن مورد بررسی قرار می گیرد:
برای تصمیم گیری در مورد پذیرش یا رد فرضیه صفر، آماره T به دست آمده با t جدول که با درجه آزادی N-K در سطح اطمینان ۹۵% محاسبه شده مقایسه می شود، چنانچه قدرمطلق T محاسبه شده از t جدول بزرگتر باشد ) (، مقدار عددی تابع آزمون در ناحیه بحرانی قرار گرفته و فرض صفر ( ) رد می شود. در این حالت با ضریب اطمینان ۹۵% ضریب مورد نظر ( ) معنی دار خواهد بود که دلالت بر وجود ارتباط بین متغیر توضیحی و وابسته دارد.
۳-۶-۴ ) آزمون های مربوط به مفروضات مدل رگرسیون خطی
مدل کلاسیک رگرسیون خطی دارای مجموعه ای از فروض تحت عنوان فروض کلاسیک میباشد که بیشتر آنها در مورد جمله خطای مدل مطرح می گردند؛ برای اینکه در مدل رگرسیون خطی، تخمین زن های حداقل مربعات معمولی ضرایب رگرسیون، بهترین تخمین زن های بدون تورش خطی (BLUE) باشند لازم است تا مفروضات این مدل بررسی و آزمون شوند. در ادامه نحوه آزمون این فرضیات بیان می گردد.
۳-۶-۴-۱ )فرض نرمال بودن توزیع متغیر ها و باقیمانده ها:
یکی از فروض مهم راجع به جمله خطا این است که توزیع نرمال دارد. در این پژوهش برای بررسی نرمال بودن توزیع خطاها از آزمون جارکیو- برا[۷۶] استفاده می شود. فرضیه صفر و آماره این آزمون بصورت زیر بوده و به توزیع با درجه آزادی ۲ گرایش دارد:
در این آماره، (ضریب چولگی) و (ضریب کشیدگی) از طریق باقیمانده های رگرسیون قابل محاسبه می باشند. فرضیه آزمون جارکیو- برا بیانگر نرمال بودن می باشد. بنابراین زمانی که مقدار آماره محاسبه شده از مقدار بحرانی آن با درجه آزادی ۲ کوچکتر باشد، فرضیه پذیرفته شده وحاکی از نرمال بودن توزیع خطاها می باشد (سوری، ۱۳۸۹، ص ۱۰۴-۱۰۲).
۳-۶-۴-۲) فرض عدم وجود همخطی[۷۷] بین متغیرهای توضیحی:
همخطی به معنای وجود رابطه بین متغیرهای توضیحی موجود در مدل می باشد به نحوی که: مخالف صفر باشد. برای تشخیص وجود همخطی روش های مختلفی وجود دارد، از جمله اینکه اگر در مدل همخطی وجود داشته باشد ضریب تعیین مدل بالا برآورد شده و در عین حال تعداد متغیرهای معنی دار موجود در مدل کم می شود. البته این نکته حائز اهمیت است که همخطی هیچیک از فروض کلاسیک را نقض نمی نماید و برآورد کننده های بدست آمده با وجود مشکل همخطی سازگار خواهند بود اما در این حالت ضرایب دارای خطای معیار بالایی خواهد بود و در نتیجه این مساله باعث می شود که تعداد متغیرهای توضیحی معنی دار در مدل کاهش بیابد. در این مطالعه برای بررسی عدم وجود همخطی از شاخص تورم واریانس[۷۸] (VIF) و ضریب همبستگی پیرسون استفاده خواهد شد. زمانی که شاخص تورم واریانس کمتر از ۵ است نشان دهنده عدم وجود همخطی شدید میباشد. همچنین در صورتی که همبستگی میان متغیرها قوی نباشد (کمتر از ۷/۰) می توان گفت همخطی شدیدی میان متغیرهای توضیحی وجود ندارد.
۳-۶-۴-۳ ) فرض مستقل بودن باقیمانده ها: