تحقیق با موضوع رگرسیون، معنی داری، تحلیل داده، داده های تابلویی

تحقیق به گروه شرکت های پذیرفته شده در بورس مراجعه خواهد شد. سپس اطلاعات مورد نیاز از طریق نرم افزار ره آورد نوین، اطلاعات موجود در کارگزاری های بورس و مطالعه صورت‏های مالی شرکت‏های پذیرفته شده در بورس اوراق بهادار تهران در طی سال‏های ۱۳۹۰- ۱۳۸۶ و بانک‏های اطلاعاتی و سایت مطالعات اسلامی بورس اوراق بهادار تهران به آدرس www.RDIS.ir استخراج و در ستون‏های Excel تجمیع می شود. در نهایت پس از محاسبه متغیرها برای آزمون، تحلیل و تفسیر نتایج جهت تصمیم گیری در خصوص فرضیات پژوهش از نرم افزارهای Eviews و Spss استفاده خواهد شد.
۳-۳-۷- آمار توصیفی
اولین مرحله تحلیل داده ها، توصیف یا تلخیص داده ها با استفاده از آمارهای توصیفی است. در تحلیل توصیفی، داده ها صرفاً برای بررسی وضع یک گروه یا یک موقعیت به‏کار می روند. مثلاً، وضعیت سنی، نوع شغل، توصیف تحصیلات و رضایت از شغل. اما تحلیل روابط و تغییرات بین متغیرها و تحلیل مجموعه متغیرها برای تبیین علت از عهده آمارهای توصیفی خارج است. شاخص های آماری توصیفی استفاده شده در این پ‍ژوهش، حداقل و حداکثر داده ها، میانگین، انحراف معیار و چولگی و کشیدگی می باشد.
۳-۳-۸- آزمون های انتخاب روش مناسب
مدل های اقتصادی از نظر استفاده از اطلاعات آماری به سه گروه تقسیم می شوند. برخی از مدل ها با استفاده از “اطلاعات سری زمانی” برآورد می شوند. برخی دیگر از مدل ها بر اساس “داده های مقطعی” برآورد می شوند، یعنی متغیرها در یک دوره زمانی معین مثلا یک هفته، یک ماه یا یک سال در واحدهای مختلف بررسی می شوند. روش سوم برآورد مدل که در مطالعات سال های اخیر نیز زیاد استفاده شده است، برآورد بر اساس “داده های پانل” است. در این روش یک سری واحدهای مقطعی در طی چند سال مورد توجه قرار می گیرند. با کمک این روش تعداد مشاهدات تا حد مطلوب، افزایش می یابد که بدین ترتیب مشکل کمبود اطلاعات نیز در این مطالعه بر طرف می شود. در همین راستا، در این پژوهش از داده های پانل برای آزمون فرضیه ها استفاده شده است.
۳-۳-۸-۱- آزمون F لیمر
برای دستیابی به اهداف پژوهش ابتدا لازم است برای قلمرو زمانی پژوهش معادلات رگرسیونی مربوطه برآورد شده و مشخص شود که مدل ها به روش داده های ترکیبی (pooled) یا داده های تابلویی (panel) برازش شود که بدین منظور از آزمون F لیمر استفاده می شود. در این آزمون، یکسان بودن عرض از مبداها (داده های تلفیقی) در مقابل ناهمسانی عرض از مبداها (روش داده های تابلویی) بررسی می شود. در آزمون F، فرضیه H0 استفاده از روش داده های تلفیقی را در مقابل فرضیه H1، یعنی استفاده از روش داده های تابلویی را نشان می دهد.
۳-۳-۸-۲- آزمون هاسمن
در صورتی که نتیجه آزمون F لیمر برآورد مدل به روش داده های تابلویی باشد لازم است تعیین شود که مدل به روش اثرات ثابت برآورد شود یا به روش اثرات تصادفی که برای این منظور از آزمون هاسمن استفاده می شود. این آزمون دارای توزیع کای- دو با درجه آزادی برابر با تعداد متغیرهای مستقل است. فرضیه H0 این آزمون بیانگر این است که بین جزء اخلال مربوط به عرض از مبدا و متغیرهای توضیحی، ارتباطی وجود ندارد و آنها از یکدیگر مستقل هستند. لذا در صورت پذیرفته شدن فرضیه H0 باید از روش اثرات تصادفی استفاده کرد. در حالی که فرضیه مقابل به این معنی است که بین جزء اخلال مورد نظر و متغیرهای توضیحی، همبستگی وجود دارد. بنابراین از آنجایی که هنگام وجود همبستگی بین اجزای اخلال و متغیرهای توضیحی، با مشکل ناسازگاری مواجه می شویم، بهتر است در صورت پذیرفته شدن H1 (رد H0)، از روش اثرات ثابت استفاده کنیم.
۳-۳-۹- تابع آماره
آزمون کولموگروف – اسمیرنف (KS)
این آزمون جهت بررسی ادعای مطرح شده در مورد توزیع داده های یک متغیر کمی مورد استفاده قرار
می‏گیرد. برای انجام تحلیل رگرسیونی ابتدا نرمال بودن متغیرها را به وسیله آزمون کولموگروف- اسمیرنف (KS) مورد بررسی قرار می‏دهیم.
H0: داده ها از توزیع نرمال پیروی می کنند
H1: داده ها از توزیع نرمال پیروی نمی کنند
یکی از مزایای آزمون (K-S) این است که هر یک از مشاهدات را به صورت اصلی در نظر می گیرد. پارامترهای مورد نظر در این آزمون شامل تعداد داده ها، پارامترهای مورد نظر در بررسی وجود توزیع (مانند میانگین و انحراف معیار در توزیع نرمال)، قدر مطلق مقدار بیشترین انحراف، بیشترین انحراف مثبت، بیشترین انحراف منفی، مقدار آماره Z و مقدار Sig (معنی داری) می باشد .
فرمول آزمون به صورت زیر می باشد:
Dn = Maximum |Fe – F0|
که در آن eF و oF به ترتیب فراوانی نظری نسبی تجمعی و فراوانی مشاهده شده نسبی تجمعی است.
نحوه داوری:
چنانچه سطح معنی داری ( Sig) بزرگ تر از ۰۵/۰ باشد نشان دهنده آن است که توزیع مشاهده شده با توزیع نظری مربوط است. به سخن دیگر فرض H1 رد و فرض H0 پذیرفته می شود، یعنی داده ها از توزیع نرمال پیروی می کنند . در صورتی که مقدار Sig محاسبه شده از ۰۵/۰ کوچکتر باشد فرض H0رد و فرض H1 پذیرفته می شود، یعنی داد ها از توزیع نرمال پیروی نمی کنند.
۳-۳-۱۰- تحلیل رگرسیون
تحلیل رگرسیون، فن و تکنیکی آماری برای بررسی و به مدل درآوردن ارتباط بین متغیرها است. به عبارت دیگر در رگرسیون به دنبال برآورد رابطه ای ریاضی و تحلیل آن هستیم، به طوری که بتوان به کمک آن کمیت یک متغیر را با استفاده از متغیر یا متغیرهای دیگر تعیین کرد. شیوه کار به این صورت است که ابتدا باید معنی داری کل مدل رگرسیون مورد آزمون قرار گیرد که این کار توسط جدول تحلیل واریانس (ANOVA) صورت می گیرد. سپس باید معنی داری تک تک ضرایب متغیرهای مستقل بررسی شود.
۳-۳-۱۰-۱- آزمون برای معنی دار بودن رگرسیون و تایید یا رد فرضیه
برای آزمون معنی دار بودن رگرسیون و تایید یا رد فرضیه از آنالیز واریانس (جدول ANOVA) استفاده می شود.
فرض آماری متناظر با آزمون به صورت زیر است:
Ho: بین دامنه اتکا بر فعالیت های مدیریت سود و نسبت پرداخت سود سهام رابطه معنی داری وجود ندارد.
H1: بین دامنه اتکا بر فعالیت های مدیریت سود و نسبت پرداخت سود سهام رابطه معنی داری وجود دارد.
نحوه داوری با توجه به مقدار آماره F و سطح معنی‏داری بدست آمده می باشد، که اگر مقدار P-value
کمتر از ۰۵/۰ باشد فرض Ho رد می شود و وجود رابطه بین متغیرها پذیرفته می شود. آزمون‏های مربوط به هر یک از ضرایب رگرسیون یکی از آزمون‏های واقعی فرضیه ها درباره پارامترهای مدل برای اندازه‏گیری مناسب مدل رگرسیون مورد استفاده قرارمی گیرد. در این آزمون از آماره t برای معنی‏دار بودن ضرایب متغیرهای مستقل استفاده می کنیم.
۳-۳-۱۰-۲- ضریب همبستگی
ضریب همبستگی یکی از معیارهای مورد استفاده در تعیین همبستگی دو متغیر می باشد و شدت رابطه و همچنین نوع رابطه (مستقیم یا معکوس) را نشان می دهد. این ضریب بین ۱ تا ۱- است (۱ r 1-) و در صورت عدم وجود رابطه بین دو متغیر برابر صفر می باشد.
ضریب همبستگی پیرسون، روشی پارامتری است و برای داده هایی با توزیع نرمال و یا تعداد داده های زیاد استفاده می شود. این ضریب از رابطه زیر محاسبه می شود:
۳-۳-۱۰-۳- آزمون دوربین- واتسون۱۲۸
یکی از مفروضاتی که در رگرسیون مد نظرقرار می گیرد ، استقلال خطاها از یکدیگر است. در صورتی که فرضیه استقلال خطاها رد شود و خطاها با یکدیگر همبستگی داشته باشند، امکان استفاده از رگرسیون وجود ندارد. برای بررسی استقلال خطاها از یکدیگر از آزمون دوربین واتسون استفاده می شود که آماره آن به کمک رابطه زیر محاسبه می شود.
: میزان خطا در سال t
: میزان خطا درسال t-1
اگر همبستگی بین خطاها را با نشان داده شود در این صورت آماره دوربین واتسون به کمک رابطه زیر
محاسبه می شود.
مقدار آماره این آزمون در دامنه ۰ و ۴+ قرار دارد زیرا:
● اگر ۰ =ρ باشد، آنگاه ۲=DW خواهد بود که نشان می دهد خطاها از یکدیگر مستقل هستند (عدم خود همبستگی)
● اگر ۱ =ρ باشد، آنگاه ۰= DWخواهد بود که نشان می دهد خطاها دارای خودهمبستگی مثبت هستند.
● اگر ۱- =ρ باشد، آنگاه ۴=DW خواهد بود که نشان می دهد خطاها دارای خودهمبستگی منفی هستند.
H0: بین خطاها همبستگی وجود ندارد
H1: بین خطاها همبستگی وجود دارد
نحوه داوری: چنانچه مقدار آماره دوربین – واتسون در فاصله ۵/۱ و ۵/۲ باشد ، فرض پذیرفته می‏شود و می توان از رگرسیون استفاده کرد ( مؤمنی ، ۱۳۸۶: ۱۲۸).
۳-۳-۱۰-۴- آزمون هم خطی
هم خطی وضعیتی است که نشان می دهد یک متغیر مستقل تابعی خطی از سایر متغیرهای مستقل است. اگر هم خطی در یک معادله رگرسیون بالا باشد بدین معنی است که بین متغیرهای مستقل همبستگی بالایی وجود دارد و ممکن است با وجود بالا بودن R2، مدل دارای اعتبار بالایی نباشد. به عبارت دیگر با وجود آنکه مدل خوب به نظر می رسد ولی دارای متغیرهای مستقل معنی داری نمی‏باشد و این متغیرها بر یکدیگر تاثیر می گذارند. برای بررسی تاثیر هم خطی بر روی نتایج پژوهش از شاخص های عامل تورم واریانس (VIF) و تلرانس استفاده شده است. مقدار شاخص VIF برای هر متغیر از طریق فرمول زیر محاسبه می شود: VIF= 1/( 1-Ri^2 )
که در آن Ri^2 ضریب تعین چندگانه رگرسیون است که به وسیله رگرسیون کردن متغیر Xi بر روی سایر متغیرهای مستقل یعنی Xj (i≠j) به دست می آید. مقادیر بزرگ تر از ۵، نشان دهنده وجود هم خطی تاثیرگذار بین متغیرها است. عامل تورم واریانس معکوس تلرانس بوده و هر چقدر افزایش یابد باعث می شود واریانس ضرایب رگرسیون افزایش یافته و رگرسیون را برای پیش بینی نامناسب سازد. هر چقدر تلرانس کمتر (نزدیک به صفر) باشد، اطلاعات مربوط به متغیرها کم بوده و مشکلاتی در استفاده از رگرسیون ایجاد می شود.
۳-۴- خلاصه فصل
در این فصل روش اجرای تحقیق به تفصیل بیان گردید. فرضیه های تحقیق، تعریف عملیاتی متغیرها و نحوه اندازه گیری آنها، جامعه آماری و نحوه انتخاب نمونه آماری، روش پردازش داده ها، مدل مورد استفاده و روش تجزیه و تحلیل داده ها تشریح شد. در فصل بعد به تجزیه و تحلیل داده ها و آزمون فرضیات تحقیق خواهیم پرداخت.
فصل چهارم
تجزیه و تحلیل داده ها
۴-۱-‏ مقدمه
تجزیه و تحلیل داده ها فرایندی چند مرحله ای است که طی آن