مشارکت زنان متاهل در بازار کار ایران: مدلسازی غیرخطی تابع لاجیت

نوع مقاله: مقاله پژوهشی

نویسندگان

1 دکتری اقتصاد

2 استادیار اقتصاد دانشگاه زابل

3 دانشیار دانشگاه صنعتی شریف

چکیده

در این مقاله یک تابع جمعی غیرخطی لاجیت برای مدل‌سازی معادله مشارکت زنان ایران مطابق با داده‌های هزینه – درآمد خانوار سال 1388 ارایه شده است. در مدل لاجیت غیرخطی از تابع ریاضی پیوسته مانند توانی، نمایی، چند جمله‌ای و لگاریتمی برای متغیرهایی هم‌چون درآمد شوهر، تحصیلات، سن زن، ثروت، تعداد بچه بالای شش سال و زیر شش سال استفاده شده است. معادله غیرخطی مشارکت زنان متاهل بر اساس معیارهای مقایسه اقتصادسنجی از جمله آزمون وایت و آماره ضریب لاگرانژ با مدل‌های لاجیت پارامتریک و ناپارامتریک مقایسه شده است. نتایج مدل‌سازی نشان می‌دهد که انتخاب تابع ریاضی مناسب می‌تواند انطعاف‌پذیری مناسبی را در مدل‌سازی دودویی فراهم کند. به طوری که موجب افزایش توانمندی و کاهش خطا مدل‌سازی نسبت به مدل‌های لاجیت پارامتریک و ناپارامتریک شده است. هم‌چنین این رویه مدل‌سازی همانند مدل ناپارامتریک همسانی واریانس داشته اما، خطای مدل‌سازی کم‌تری را نتیجه داده است.

کلیدواژه‌ها


1. مقدمه

اقتصاد خانواده و نیروی کار زنان یکی از زیر شاخه‌ها و موضوعات داغ علم اقتصاد در سه دهه اخیر است. در طی دو قرن اخیر، جهان شاهد پدیده اقتصادی- اجتماعی جدیدی به نام مشارکت زنان در بازار کار بوده است. به طوری که، نرخ مشارکت زنان کشورمان از 9/12 درصد در سال 1383، به 2/16 درصد در سال 1388 افزایش یافته است. هم‌چنین نرخ بیکاری زنان دارای تحصیلات عالی، از 6/23 درصد در سال 1383 به 3/9 درصد در سال 1388 تقلیل پیدا کرده است (سالنامه آماری کشور 1388). با توجه به این موارد پیش‌بینی می‌شود که در سال‌های آینده نرخ مشارکت زنان و عرضه کار آنان همچنان از روندی فزاینده برخوردار باشد.

رفتار عرضه نیروی کار زنان استنباط‌های مهمی برای دیگر پدیده‌ها شامل ازدواج، باروری، طلاق، توزیع درآمد خانوار و تفاوت دستمزدی زن و مرد دارد. علاوه بر این، افزایش اشتغال زنان می‌تواند موجب افزایش رشد اقتصادی کشورها، کاهش شکاف میان درآمد زن و مرد و کاهش تبعیض جنسی، باروری کمتر، فاصله زمانی بیشتر میان ازدواج و تولد نخستین فرزند، کاهش ساعت کار هفتگی، افزایش شهر نشینی، کاهش نرخ تورم و بیکاری و هم‌چنین قوانین و شیوه عملکرد ‌شود (مینسر[1] 1962 و سانتا[2] و بث[3] 1979).

با توجه به نقش پراهمیت زنان متاهل در خانواده، لازم است نسبت به پدیده تخمین مشارکت زنان متاهل نگاه ویژه‌ای داشت و از آن در راستای اتخاذ سیاست‌های کنترل بیکاری مردان، اشتغال‌زایی و سیاست‌های حمایت از خانوار، استفاده نمود. برای تخمین پارامترهای معادله مشارکت زنان که بیانگر دو حالت می‌باشد از مدل‌های احتمال خطی، مدل پروبیت و لاجیت می‌توان استفاده کرد. مدل‌های خطی به دلیل تبعیت واریانس خطا از متغیرهای مستقل و نیز عدم تامین شرط ، مشکلاتی ویژه‌ای از جمله: نرمال نبودن توزیع و ناهمسان بودن جملات خطا دارند. از طرف دیگر، اثر نموی یا نهائی X در سرتاسر طول تغییرات در مدل خطی ثابت است که این امر مشکل جدی را برای تخمین ضرائب مدل فراهم می‌آورد. مدل‌های لاجیت و پروبیت این قابلیت را دارند که با افزایش متغیر  مقدار  افزایش ‌یابد به طوری که، هیچ گاه خارج از محدوده صفر تا یک قرار ‌نگیرند و دیگر این که، در این مدل‌ها ارتباط بین  و  غیرخطی است. مدل لاجیت نسبت به مدل پروبیت عموماً به علت سهولت عملیات ریاضی در ارجحیت قرار دارد ( بنکو و مارتینز[4] 2009، معّلوف و ترافلیس[5] 2011). ناهم‌سانی واریانس به عنوان یک مشکل اساسی در مدل لاجیت شناخته شده است (کشاورز حداد و باقری قنبر آبادی،1390؛ فرولیک[6]، 2006) که برای رفع ناهم‌سانی واریانس به تکنیک‌های مدل‌سازی ناپارامتریک توجه شده است. این مقاله با هدف ارایه یک معادله ریاضی غیرخطی دودویی (لاجیت) برای پیش‌بینی احتمال مشارکت زنان پایه‌گذاری شده که این مدل غیرخطی دارای متغیرهای مستقل پیوسته (درآمد همسر و درآمد غیرکاری)، گسسته (سن، شهری و روستایی، تعداد فرزندان بالا و زیر 6 سال) و رتبه بندی شده (سواد) می‌باشد. بر اساس مدل ارایه شده به دنبال پاسخ‌گویی به سولات زیر هستیم.

الف) آیا مدل برآورد شده همسانی واریانس دارد؟

ب) آیا مدل غیرخطی نسبت به مدل‌های پارامتریک و ناپارامتریک برازش بهتری دارد؟

این مقاله شامل پنج بخش اساسی است که در بخش دوم، به بیان ادبیات موضوع پرداخته شده است. بخش سوم، روند مدل‌سازی که شامل تخمین ضرایب مدل‌غیرخطی به کمک روش حداکثر درست نمایی مدل لاجیت و آزمون‌های فرض مناسب جهت نیکویی برازش می‌باشد. بخش چهارم، مدل غیرخطی ارایه شده با مدل‌های پارامتریک و ناپارامتریک مطابق با معیارهای اقتصاد سنجی مقایسه شده و در انتها، خلاصه‌ای از نتایج ارایه شده است.

 

2. ادبیات موضوع

مدل نئوکلاسیک عرضه نیروی کار جهت بررسی رفتار کار زنان  متاهل استفاده می‌شود. در این نظریه فرض بر آن است که یک شخص زمان قابل دسترس خود را بین کار کردن و استراحت تخصیص می‌دهد. کلینگورس[7] (1986) به ارتباط اعضای خانواده جهت تصمیم‌گیری برای مشارکت در بازار کار اشاره نمود. رویکرد سنتی تصمیم‌گیری عرضه کار خانوار به عنوان مدل واحد شناخته شده که درآن رفتار خانوار به عنوان واحد تصمیم گیری اساسی در نظر گرفته      می‌شود. در این مدل، ترجیحات خانوار به وسیله تابع مطلوبیت یکنواخت و قید بودجه حداکثر    می‌شود (فورتین[8] و لکرویز[9] 1997). چیاپوری[10] (1988 و 1992) مدل عرضه کار جمعی را که یک رویکرد ثابت بوده و رفتار خانواده به وسیله یک تابع مطلوبیت منحصر به فرد مدل‌سازی می‌شود، پیشنهاد نموده است. دونی[11] (2007)، فرضیات اصلی چیاپوری (1988 و 1992) را از طریق مدل مشارکتی بر اساس محدودیت‌های بودجه مطابق با تابع نیمه لگاریتمی بسط داد. برولاوا[12] و چیکاوا[13] (2012) رفتار عرضه کارخانوار کشورهای رمانی، گرجستان و فرانسه را با استفاده از ساختار جمعی چیاپوری و همکاران (1992) تحلیل و با یکدیگر مقایسه نمودند.

لکنر[14] (1991) با استفاده از مدل لاجیت به بررسی مشارکت در بازار کار زنان فرانسه پرداخت. اثر ناهم‌سانی واریانس در این مدل توسط وی آزمون شد و مشخص گردید که مدل لاجیت وی، ناهم‌سانی واریانس دارد و از طرفی وی جهت رفع آن اقدامی ننمود. بعدها، گرفین[15] (1996) به کمک یک تابع خطی مدل پروبیت، مشارکت زنان متاهل آلمانی و سوئدی را برآورد نمود و با مدل پارامتریک لکنر (1991) برای این گروه از زنان، مقایسه کرد. وی نشان داد که این مدل همانند مدل لکنر ناهم‌سانی واریانس دارد. سپس بر اساس یک مدل شبه پارامتریک ارایه شده توسط کلین و اسپادی (1993)، اقدام به رفع ناهم‌سانی واریانس نمود. هم‌چنین وی نشان داد که تحصیلات زن و تعداد فرزندان به ترتیب اثر مثبت و منفی بر مشارکت زن در بازار کار دارد.

ناواتا[16] (1995) روش برآورد حداکثر درست نمایی را برای تخمین ضرایب معادله عرضه کار زنان بر اساس داده‌های شبیه سازی روش مونت کارلو، پیشنهاد نموده و نشان داد که برآورد‌گر حداکثر درست نمایی نسبت به روش حداقل مربعات از کارایی بهتری برخوردار است.

گونگ[17] و ‌سوئست[18] (2000)، عرضه کار زنان متاهل در کشور مکزیک را بررسی نمودند. هم‌چنین گارسیا[19] و همکاران (2002) به بررسی رفتار نیروی کار زنان اسپانیا پرداختند آن‌ها مشکل ناهم‌سانی واریانس را از طریق رویکرد هاسمن به کمک آماره وایت[20] (1982) آزمون نموده و نتیجه گرفتند که در مدل آن‌ها ناهم‌سانی واریانس برطرف شده است.

فرولیک (2006) با استفاده از رگرسیون ناپارامتریک، تخمینی برای متغیرهای مجازی بر اساس تابع کرنل هیبریدی ارایه نمود. وی با استفاده از روش تخمین‌زن حداکثر درست نمایی لاجیت موضعی و شبیه‌سازی داده‌های ورودی به کمک روش مونت کارلو، ضرایب ثابت توابع خطی، مرتبه دو و ترکیب آن دو را برآورد نمود. وی نشان داد که رگرسیون ناپارامتریک با تابع کرنل یک راه‌کار مناسب جهت رفع ناهم‌سانی واریانس در مدل‌سازی لاجیت می‌باشد.

کشاورز حداد و باقری قنبر آبادی (1390) بر اساس یک مدل ناپارامتریک به تحلیل مشارکت زنان شهری و روستایی ایران پرداختند. آن‌ها در مدل ناپارامتریک خود، از یک وزن مطابق با تابع کرنل هیبریدی (فرولیک 2006) در برآوردگر حداکثر درست نمایی مدل لاجیت جهت تخمین مشارکت زنان متاهل، استفاده کردند. هم‌چنین، ناهم‌سانی وایانس را در مدل ناپارامتریک و پارامتریک آزمون نمودند و نتیجه گرفتند که مدل ناپارامتریک ناهم‌سانی واریانس را برطرف نموده است.

 

3. روش مدلسازی

استفاده از مدل لاجیت جهت تخمین برآوردهای دودویی مورد توجه محققین قرارگرفته است (بنکو و مارتینز 2009؛ معّلوف و ترافلیس 2011). با استفاده از توابع غیرخطی می‌توان، انعطاف‌پذیری لازم در انتخاب نوع تابع مدل برای متغیرهای مستقل فراهم نمود. در مدل توسعه داده شده، متغیرهای مستقل به طور مجزاء با شکل تابع مربوط به خود، وارد شده و این امکان را برای مدل‌ساز فراهم می‌آورد که برای یک متغیر مستقل جهت برآورد بهترین شکل تابعی، انواع توابع خطی و غیرخطی را بررسی و ارزیابی کرد و علاوه بر کاهش خطای مدل‌سازی تا حد امکان اثر ناهم‌سانی واریانس را نیز برطرف نمود.

 

3-1. معرفی دادههای پژوهش            

جهت تعیین مدل مشارکت زنان ایران از داده‌های هزینه‌ درآمد خانوار مرکز آمار ایران استفاده شده است. داده‌های آماری مربوط به اطلاعات 10273 خانوار متاهل بر مبنای گزارش سال 1388 بوده که اطلاعات هزینه‌ درآمد خانوار برای زنان متاهل سنین تا 60 (حداکثر سن برای کار) در نظر گرفته شده است. در این مجموعه 5221 خانوار از 10273 زن متاهل در شهر سکونت دارند و 1632 زن متاهل مشغول به کار هستند. خلاصه‌ای از خصوصیات آماری متغیرهای مورد بررسی در جدول (1) ارایه شده است.

 

جدول 1. خصوصیات آماری متغیرهای مستقل

حداکثر

حداقل

انحراف معیار

میانگین

مشاهدات

متغیرها

5

0

93674/0

94461/0

10273

تحصیلات

1

0

49996/0

50823/0

10273

شهری و روستایی

667/166

0

23435/4

90910/2

10273

دستمزد مرد

1000

0

17865/19

14207/5

10273

ثروت

60

14

35120/10

45196/35

10273

سن زن

4

0

67219/0

45936/0

10273

بچه زیر 6 سال

10

0

35953/0

49324/1

10273

بچه بالای 6 سال

 

متغیرهای تعداد فرزندان زیر 6 سال(UK6)  و بالای 6 سال  (AK6) بین 7 تا 19 سال در نظر گرفته شده‌اند. متغیر شهری و روستایی (RU) مشخص کننده محل سکونت زن (شهر(عدد یک)، روستا (عدد صفر))، متغیر میزان تحصیلات زن (edu) که به صورت 6 رتبه دسته‌بندی شده و شامل صفر بی‌سواد، یک تحصیلات تا سوم راهنمائی، عدد 2 تحصیلات بالای سوم راهنمائی و زیر دیپلم، عدد 3 تحصیلات بالای دیپلم و زیر فوق دیپلم، عدد 4 تحصیلات بالای فوق دیپلم و زیر لیسانس و دانشجویان دوره کارشناسی نیز در این رتبه قرار می‌گیرند، عدد 5 بیانگر فوق لیسانس به بالا و نیز پزشکی می‌باشد. متغیرهای ثروت (INC) و دستمزد ماهیانه مرد (WM) را بر حسب یک میلیون ریال در مدل‌سازی لحاظ شده است.

3-2. فرایند مدلسازی

جزییات روند مدل سازی مشارکت زنان می‌تواند مطابق با مراحل زیر تشریح گردد.

1-      انتخاب یک تابع ریاضی مناسب (توانی، نمایی، لگاریتمی) برای متغیر ورودی

2-      تعیین ضرایب مدل بر اساس روش حداکثر درست نمایی

3-      محاسبه آماره مقایسه مدل

4-      مراحل 1 تا 3 برای تمامی‌توابع ریاضی کاندید شده انجام می‌گردد

5-       انتخاب بهترین تابع ریاضی بر اساس آماره های مقایسه در مرحله 3

6-      مراحل 1 تا 5 برای متغیر بعدی نیز انجام می‌گیرد

7-      مدل انتخاب شده نیکویی برازش می‌شود

3-2-1. نحوه انتخاب متغیرها

بین داده‌های ورودی بیشترین هم‌بستگی مشارکت زنان با تحصیلات (228/0) مشاهده می‌شود. بنابراین به عنوان متغیر اول به مدل اضافه می‌گردد. درآمد شوهر نیز کم‌ترین هم‌بستگی با داده‌های مشارکت زنان دارد اما نمی‌توان گفت که درآمد شوهر آخرین متغیر ورودی در مدل می‌باشد. زیرا این متغیر نیز با سایر متغیرها هم‌بستگی دارد. از این‌رو، از یک ضریب به صورت نسبت ضریب هم‌بستگی داده‌ها به ضریب هم‌بستگی متغیرهای ورودی در مدل، برای متغیرهای باقیمانده استفاده می‌شود.

(1)

 

که در آن  و  به ترتیب ضریب هم‌بستگی بین متغیر مستقل  با متغیر  و متغیر وابسته  با متغیر مستقل  است.   نسبت ضریب هم‌بستگی متشکل از متغیرهای ورودی قبلی برای متغیر باقیمانده iام است. متغیر ورودی دوم، متغیری است که ضریب  آن بیش‌ترین مقدار باشد. برای متغیر سوم کاندید شده از ضریبی استفاده می‌شود که اثرات هم‌بستگی متغیرهای اول و دوم را داشته باشد ( ). ضریب  در جدول (2) ارایه شده است.   کاندیدهای دوم تا هفتم برای ورود متغیرها به مدل به صورت مرحله به مرحله شامل ثروت، شهری و روستایی (موقعیت جغرافیایی)، بچه بالای 6 سال، بچه زیر 6 سال، دستمزد شوهر و سن زن می‌باشد.

 

جدول 2. نسبت ضریب همبستگی متغیر با مشارکت به ضریب همبستگی متغیر با متغیرهای وارد شده

بچه بالای

 6 سال

بچه زیر

 6 سال

ثروت

دستمزد شوهر

سن زن

شهری و روستایی

متغیر ورودی

کاندید

0776/0

1544/0

3092/0

0078/0

0364/0

2076/0

تحصیلات

1

1073/10

1162/1

--

1550/0

1627/0

2341/19

ثروت

2

1781/57

4927/22

--

3081/1

4766/4

--

شهری و روستایی

3

--

1610/2929

--

9920/119

9014/12

--

بچه بالای 6 سال

4

--

--

--

3070/2718

1205/25

--

بچه زیر 6 سال

5

 

3-2-2. انتخاب توابع برای هر متغیر مستقل

شهری و روستایی بودن به صورت یک متغیر مجازی بوده که برای آن از تابع خطی( ) استفاده شده است. برای سایر متغیرها از توابع ریاضی پیوسته مانند توانی، نمایی، لگاریتمی و چند جمله‌ای استفاده شده که به صورت زیر می‌باشند:

(2)

 

(3)

 

(4)

 

(5)

 

که در آن: ها ضرایب مدل  برای متغیر مستقل  است.

3-2-3. تخمین ضرایب تابع

یک رهیافت مرسوم در مدل‌سازی انتخاب‌های دوتائی، مدل‌های احتمالی برنولی است. بنابراین  که  F تابع توزیع تجمعی لاجستیک برای مدل غیرخطی  است (بنکو و مارتینز 2009، معّلوف و ترافلیس 2011).

(6)

 

تابع ناپارامتریک حداکثر درست‌نمایی به صورت زیر بیان می‌شود (معّلوف و ترافلیس[21] 2011):

(7)

 

همان طوری که گفته شد  یک تابع غیرخطی از متغیرهای مستقل مساله می‌باشد. هم‌چنین بخش  در معادله (7) برای به دست آمدن بهترین تعمیم اضافه شده است.

3-2-4. انتخاب تابع مناسب برای هر متغیر

بعد از تخمین ضرایب توابع کاندید شده، این توابع به کمک آماره ضریب اطمینان[22] با هم مقایسه شده و بهترین تابع برای متغیر مورد نظر انتخاب می‌گردد که اماره ضریب اطمینان به صورت زیر قابل محاسبه است (ویلموت و ماتسورا[23] 1998):

(8)

 

که در آن D ضریب تطبیق[24] و EF ضریب کارایی[25] است که به صورت زیر محاسبه می‌شوند:

(9)

 

(10)

 

 

که در آن  و  به ترتیب مقدار پیش‌بینی و مشاهده شده مشارکت زن iام و n تعداد داده‌ها می‌باشد و  و  به ترتیب مقدار میانگین داده‌های پیش‌بینی و مشاهدات است. اگر مقدار C=0گردد بین داده‌های پیش‌بینی و مشاهده هیچ وابستگی وجود ندارد و برآود نادرست می‌باشد و C=1دلالت به تطبیق کامل مدل ارایه شده با داده‌های پیش‌بینی دارد.

با توجه به برآوردگر حداکثر درست نمایی برای متغیر ورودی اول (سواد زن)، ضرایب چندین توابع ریاضی محاسبه شده که نتایج برآورد ضرایب توابع و ضریب اطمینان در جدول (3) لیست شده است. مشخص است که بهترین مدل انتخابی به صورت  می‌باشد.

 

جدول 3. مقایسه مدلهای ریاضی معادله مشارکت نسبت به متغیر اول (تحصیلات)

توابع ریاضی

   

C=EF.D

شماره انتخاب

 

5792/1-

0038/0

0113/0

5

 

7302/2-

7638/0

0119/0

4

 

2392/3-

3194/0

0231/0

2

 

5292/1-

6448/0

0093/0

7

 

9602/1-

0404/0

0107/0

6

 

0301/2-

1608/0

0253/0 (1)

1

 

1725/2-

4959/1

0193/0

3

(1) بیش‌ترین ضریب اطمینان

 

 

3-2-5. خوبی برازش مدلها

از آزمون‌های خوبی برازش دوربین- واتسون[26] (DW) و وایت[27] استفاده شده که به ترتیب به توان هم‌بستگی بین خطاها و اثر ناهم‌سانی واریانس خطاها را تست کرد که با آماره آزمون منحصر به فرد و مقدار مجاز مناسب توابع توزیع و فیشر با سطح معناداری 5 درصد مقایسه شده است. جهت ارزیابی هم‌بستگی جملات خطا از آماره DW استفاده شده است که می‌توان اثر هم‌بستگی بین جملات خطا را آزمون نمود (دوربین و واتسون 1971؛ اسد و الحمیدی[28] 2002). یکی از دغدغه‌های اساسی در اقتصاد سنجی، مساله ناهم‌سانی واریانس است. اگر توزیع واریانس جملات خطا مشخص نباشد، استفاده از آماره وایت جهت آزمون ناهم‌سانی در واریانس می‌تواند مفید باشد (وایت 1980).

3-3. مدل غیرخطی مشارکت زنان ایران

مطابق با بخش 3-2، سایر متغیرها وارد مدل شده و تابع ریاضی مناسب برای هر متغیر بر اساس ضریب اطمینان انتخاب شده و تابع ریاضی لاجیت غیرخطی زیر برای معادله مشارکت زنان حاصل شده است:

(11)

 

تابع فوق به صورت گام به گام برای هر متعیر ورودی مطابق با نتایج جدول (2)، ضرایب آن بر اساس رابطه (7) محاسبه شده است که در آن:

edu

= میزان تحصیلات زن با بهترین فرم ریاضی

INC

= میزان ثروت خانوار با بهترین فرم ریاضی

RU

= شهری وروستایی بودن خانوار با تابع

AK6

= تعداد بچه های بالای 6 سال خانوار با بهترین فرم ریاضی  

UK6

= تعداد بچه های زیر 6سال خانوار با بهترین فرم ریاضی

WM

= میزان دستمزد همسر با بهترین فرم ریاضی

age

= سن زن با بهترین فرم ریاضی

برای دو متغیر پیوسته ثروت و دستمزد شوهر به ترتیب تابع غیرخطی به صورت توانی و نمایی بر اساس معیار انتخاب ضریب اطمینان انتخاب شده‌اند. توابع نمایی و توانی یک حالت خاص از تابع لگاریتمی هستند. در مدل‌های عرضه کار برای درآمد خانوار، (دستمزد زن و شوهر و هم‌چنین درآمد غیرکاری و ثروت) محققین از شکل لگاریتمی استفاده کرده‌اند (چیاپوری 1988، دونی 2007؛ برولاوا و چیکاوا 2012). از این‌رو، رویکرد انتخاب بهترین تابع برای متغیرهای مستقل توانایی تطبیق مناسب را بر مشارکت زنان می‌تواند داشته باشد. برای متغیرهای تحصیلات، سن زن و بچه زیر شش سال یک رابطه غیرخطی درجه دو انتخاب شده که بیش‌ترین تطبیق را با داده‌های پیش‌بینی مشارکت زنان دارد.

در جدول (4) ضرایب مدل‌سازی و فاصله اطمینان مربوطه و هم‌چنین مقایسه آن‌ها با آماره Z برای مدل غیرخطی هفت متغیره نشان داده شده است. مشخص است که تمامی ضرایب در محدوده مجاز قرار گرفته است. در شکل (1) نمودار پراکندگی مربع خطا نسبت به مقادیر پیش‌بینی رسم شده است. شیب خط رگرسیون خطی عدد کوچکی حاصل شده که حاکی از وابستگی ناچیز خطا با اعداد پیش‌بینی می‌باشد. آماره دوربین- واتسون در این مدل عدم هم‌بستگی بین خطاها را نشان می‌دهد (033/2 DW=). آماره وایت 21/5 حاصل شده که عدد کوچکی است و مشخص است که این مدل هم‌سانی واریانس در خطا دارد.

 

جدول 4. مقایسه آمارههای ضرایب معادله مشارکت مدل غیرخطی

محدوده 95% اطمینان ظرایب

P>|z|

آماره z

استاندارد خطا

ضرایب

پارامترها

7138/2-

8284/2-

000/0

2222/95-

0291/0

7711/2-

 

2043/0

1775/0

000/0

2601/29

0065/0

1909/0

 

0132/0-

0389/0-

000/0

8321/9-

0027/0

0261/0-

 

96/1×5-10

24/1×5-10

000/0

4712/12

28/1×6-10

60/1×5-10

 

2721/0

1215/0

000/0

3476/10

0190/0

1968/0

 

0756/0

0379/0

000/0

7548/10

0053/0

0567/0

 

0644/0

0269/0

000/0

1771/10-

0045/0

0456/0-

 

7189/0-

8173/0-

000/0

8915/31-

0241/0

7681/0-

 

0410/0

0168/0

000/0

1385/10

0029/0

0289/0

 

1996/0

1283/0

000/0

7377/12

0129/0

1640/0

 

 

اثر متغیرها بر همسانی خطا برای مدل غیرخطی با آماره ضریب لاگرانژ[29] (LM) (برا و بلیس[30] 2001) آزمون شده است. مقدار آماره LM  برای ضرایب  برابر با 11/2 حاصل شده که از مقدار مجاز (مقدار تابع  با سطح معناداری 5 درصد و دو درجه آزادی، برابر با 991/5) کمتر است. بنابراین سه جزء  و  در معادله مشارکت غیرخطی باعث ناهم‌سانی واریانس نمی‌گردد.

 

 

P=1493/0e2+0851/0

شکل 1. معادله خط پیشبینی نسبت به توان دو خطا در مدل غیرخطی

 

 

 

 

 

 

 

 

 

4. مقایسه مدلهای پارامتریک و ناپارامتریک با مدل غیرخطی

معادله پارامتریک مدل مشارکت به صورت زیر می‌باشد.

(12)

 

مدل پارامتریک برای داده‌های با اثر مقطعی ایجاد ناهم‌سانی واریانس می‌کند به عبارتی دیگر، مدل لاجیت پارامتریک برای زنان با مشخصات فردی و اقتصادی یکسان، پاسخ مشابه‌ای از احتمال مشارکت برآورد کرده که ممکن است عکس العمل زنان به مشارکت در بازار کار متفاوت باشد. مدل لاجیت پارامتریک جهت تخمین پارامترهای تابع مشارکت زنان بر پایه فروض استاندارد کلاسیک استوار است. در صورت عدم برقراری این فروض (جملات خطا از تابع توزیع نرمال با میانگین صفر پیروی می‌کنند) تخمین حاصله از اعتبار کم‌تری برخوردار است. بنابراین برای پرهیز از نقایص مدل لاجیت از تکنیک‌های اقتصاد سنجی ناپارامتریک استفاده شده است (فرولیک 2006) که به توان به کمک آن فرض تصادفی بودن تخمین را برای هر نفر به صورت مجزاء لحاظ نمود. روش‌های لاجیت ناپارامتریک موضعی برای تخمین ضرایب مدل مشارکت زنان ایرانی استفاده شده که با استفاده از رویه حداکثر درست نمایی به صورت زیر قابل بیان است (فرولیک 2006، کشاورز حداد و باقری قنبر آبادی 1390):

                                                      (13)

از آنجا که متغیر  شامل متغیرهای گسسته و پیوسته است، بنابراین تابع کرنل هیبریدی  معرفی­شده توسط راسن و لی[31] (2004) به عنوان وزن استفاده می‌شود.

(14)

 

برای این تابع کرنل  محاسبه شده است و Q تعداد کل متغیرها؛ برابر با 7 است.  تعداد متغیرهای پیوسته که شامل متغیر ثروت و دستمزد شوهر است             ( ).  تعداد متغیرهای گسسته و رتبه‌بندی شده را نشان می‌دهد که شامل سن زن، سواد، بچه بالای شش سال و زیر شش سال می‌باشد بنابراین  و این مدل شامل یک متغیر مجاری شهری و روستایی می‌باشد. نتایج ضرایب مدل تحلیل رگرسیون ناپارامتریک و پارامتریک (12) بر مبنای رویه رگرسیون حداکثر درست نمایی در جدول 5 درج شده است. مشخص است که اثر متغیرها در دو مدل پارامتریک و ناپارامتریک یکسان (هم علامت) برآورد شده اما، میزان تاثیر هر متغیر متفاوت (مقدار ضرایب متفاوت) برازش شده است. به طوری که بچه بالای شش سال تاثیر مثبت بیش‌تری و بچه زیر شش سال و دستمزد شوهر تاثیر منفی بیش‌تری در مدل ناپارامتریک نسبت به مدل پارامتریک نشان داده است. ثروت و دستمزد شوهر هر دو متغیر بر مشارکت زنان اثر منفی داشته، زیرا  افزایش درآمد خانوار موجب می شود که فرد رمان بیش‌تری را به فراغت اختصاص دهد از این‌رو، افزایش فراغت بر تصمیم‌گیری زن به مشارکت تاثیر گذاشته و موجب کاهش احتمال حضور آنان در بازار کار می‌گردد.

 

 

 

جدول 5. ضرایب مدل پارامتریک و ناپارامتریک

ناپارامتریک

پارامتریک

پارامترها

استاندارد خطا

ضرایب

استاندارد خطا

ضرایب

0305/0

8197/2-

0280/0

5111/2-

 

0010/0

0214/0-

0014/0

0312/0-

 

0011/0

0163/0

0005/0

0079/0

 

0064/0

1135/0-

0037/0

0613/0-

 

0004/0

0056/0-

0002/0

0034/0-

 

0036/0

0453/0-

0005/0

0071/0-

 

0093/0

1125/0

0042/0

0606/0

 

0311/0

6341/0

0287/0

6339/0

 

 

چندین آماره مقایسه بر مبنای مدل‌های لاجیت  غیرخطی، پارامتریک و ناپارامتریک در جدول (6) ارایه شده است.

 

جدول 6. مقایسه مدل های مختلف ارایه شده جهت مشارکت

یکهای برآورد شده (1)

 

ضریب لاگرانژ

آماره وایت

ضریب کارایی (EF)

مدلسازی

211

4/4228

02/9

78/43

0749/0

پارامتریک

491

2/4237

42/0

19/4

0714/0

ناپارامتریک

634

6/4086

91/0

21/5

1015/0

غیرخطی

(1) تعداد یک های واقعی در داده ها برابر با 1632 عدد است

 

مشخص است که ضریب کارایی (EF) مدل غیرخطی نسبت به مدل‌های پارامتریک و ناپارامتریک بیش‌تر نتیجه شده است. آماره وایت مدل غیرخطی بسیار نزدیک به مدل ناپارامتریک حاصل شده بنابراین همانند مدل ناپارامتریک ه‌سانی واریانس دارد. اما، مدل غیرخطی خطای کم‌تری نسبت به مدل ناپارامتریک دارد (مقدار تابع حداکثر درست نمایی  کم‌تری دارد). تعداد احتمال‌های مشارکت بیشتر از 5/0، ( زنان کارمند) برای هر مدل در جدول (6) به صورت یک‌های برآورد شده، نشان شده است. مشخص است مدل ناپارامتریک نسبت به مدل پارامتریک تعداد یک‌های بیشتری برآورد نموده است (در حدود 4/2 برابر). مدل غیرخطی یک‌های بیش‌تری را نسبت به مدل ناپارامتریک تخمین زده است (اختلاف یک ها در حدود 130 عدد می‌باشد). از این رو، مدل غیرخطی ارایه شده علاوه بر تخمین مناسب، کارایی بیش‌تری نیز نسبت به مدل پارامتریک و ناپارامتریک دارد.

آماره ضریب لاگرانژ، برای این مدل غیرخطی (11) با حذف متغیر سن زن، برای مدل ناپارامتریک با حذف متغیر ثروت و تعداد بچه بالای شش سال و برای مدل ناپارامتریک با حذف متغیرهای بچه بالای شش سال و ثروت (این متغیرها بیش‌ترین مقدار آماره Z را دارند) محاسبه شده که در جدول (6) مقدار آن درج گردیده است. آماره ضریب لاگرانژ برای مدل لاجیت پارامتریک، برابر با 02/9 نتیجه شده که در ناحیه بحرانی قرار گرفته (841/3) و فرض عدم ناهم‌سانی واریانس این مدل تایید می‌گردد. بنابراین جملات خطای مدل پارامتریک نسبت به متغیرهای ثروت و تعداد بچه بالای شش ناهمسان نتیجه شده است. مدل مشارکت ناپارمتریک (13) ضریب لاگرانژ آن خیلی کمتر از مقدار مجاز (841/3) نتیجه شده است. بنابراین مدل مشارکت ناپارامتریک نسبت به جزء ثروت و بچه بالای شش سال هم‌سانی واریانس خطاها دارد که ممکن است به علت در نظر نگرفتن توزیع خاصی برای خطای مدل رگرسیونی باشد. حسن مدل ناپارامتریک، نسبت به پارامتریک برطرف کردن ناهم‌سانی واریانس می‌باشد.

 در شکل (2) نمودار پراکندگی داده‌های مدل غیرخطی نسبت به مدل ناپارامتریک نشان داده شده است. مشخص است که پراکندگی اعداد در این دو مدل بسیار زیاد می‌باشد بنابراین می‌توان اظهار داشت که مدل‌غیرخطی نسبت به مدل ناپارامتریک از نتایج متفاوتی برخوردار است و مقدار احتمال مشارکت در این دو مدل متفاوت نتیجه شده است.

 

 

 

 

 

شکل 2. نمودار پراکندگی دادههای مدل غیرخطی و ناپارامتریک

 

 
   

 

 

 

 

 

 

 

 

 

 

 

 

5. بحث نتایج مدلسازی

اثر نهایی متغیرهای ورودی با استفاده از مدل غیرخطی (رابطه 15) و هم‌چنین مدل‌های پارامتریک (معادله 16، لکنر 1991) و ناپارامتریک مبتنی بر تابع کرنل موضعی (فرولیک 2006، کشاورز حداد و باقری قنبر آبادی 1390) مقایسه شده است. نتایج تاثیر متغیرهای تحصیلات، ثروت، بچه بالای شش سال، بچه زیر شش سال، دستمزد ماهانه شوهر و سن زن در جدول (7) ارایه گردیده است. عکس‌العمل زنان نسبت به حضور در بازار کار با مشخصات فردی یکسان در مدل‌های غیرخطی، ناپارامتریک و پارامتریک، به ازای تغییر بعضی از متغیرها، متفاوت نتیجه شده است. به طوری که تاثیر احتمال مشارکت زن نسبت به متغیر تحصیلات در مدل پارامتریک نسبت به مدل‌های ناپارامتریک و غیرخطی متفاوت نتیجه شده است.

متغیرهایی هم‌چون تحصیلات، بچه بالای شش سال و سن زن تاثیر مثبتی بر احتمال حضور آن در بازار کار دارد که بیش‌ترین تاثیر به ازای متغیر تحصیلات حاصل شده است. از این‌رو، می‌توان اظهار داشت که در صورت افزایش تحصیلات زن، اثر مثبتی از تصمیم‌گیری زن جهت حضور در بازار کار شاهد خواهیم بود. متغیرهای بچه زیر 6 سال، دستمزد همسر و ثروت اثر منفی بر مشارکت زن را دارند که بیش‌ترین اثر منفی به ازای دستمزد شوهر در مدل‌های پارامتریک و ناپارامتریک و در مدل غیرخطی به ازای بچه زیر شش سال حاصل گردیده است. نیاز به نگهداری و تربیت کودک بچه زیر شش سال موجب افزایش زمان حضور زن در خانه شده بنابراین موجب کاهش احتمال حضور زن در بازار کار می‌شود. انعطاف‌پذیری تغییرات فرزند زیر شش سال در مدل غیرخطی ارایه شده بر خلاف مدل پارامتریک به خوبی مشاهده شده است. بنابراین می‌توان نتیجه گرفت که مدل غیرخطی سازگاری لازم را جهت برآورد احتمال مشارکت زنان تامین می‌کند.

 

جدول 7. مقایسه اثر نهایی متغیرهای ورودی در مدلهای پارامتریک، ناپارامتریک و غیرخطی

مدل غیرخطی

مدل ناپارامتریک

مدل پارامتریک

مشاهدات

متغیرها

انحراف معیار

میانگین

انحراف معیار

میانگین

انحراف معیار

میانگین

0686/0

0839/0

0272/0

0829/0

0264/0

0645/0

10273

تحصیلات

0139/0

0062/0-

0020/0

0007/0-

0020/0

0007/0-

10273

ثروت

0027/0

0072/0

0044/0

0094/0

0026/0

0066/0

10273

بچه بالای 6

0251/0

0262/0-

0017/0

0036/0-

0003/0

0008/0-

10273

بچه زیر 6

0074/0

0106/0-

0105/0

0110/0-

0086/0

0087/0-

10273

دستمزد شوهر

6/1×5-10

1/4×5-10

3/6×5-10

3/1×5-10

4/3×6-10

4/8×6-10

10273

سن زن

 

6. خلاصه و نتیجهگیری

یک معادله ریاضی غیرخطی دودویی (لاجیت) برای برآورد احتمال مشارکت زنان ایرانی ارایه شده است که شامل متغیرهای مستقل پیوسته (درآمد همسر و ثروت)، گسسته (سن، شهری و روستایی، تعداد فرزندان بالا و زیر 6 سال) و رتبه بندی شده (سواد) می‌باشد. نتایج زیر را به صورت خلاصه می تواند برای این مدل بیان کرد.

1-     مدل غیرخطی ارایه شده وابستگی بین جملات خطا مشاهده شده است.

2-     حسن مدل ناپارامتریک نسبت به پارامتریک برطرف کردن ناهم‌سانی واریانس خطا می‌باشد. اما نسبت به مدل‌غیرخطی هم‌بستگی کم‌تری و خطای بیش‌تری را برآورد نموده است.

3-     رویه ارایه شده مدل‌سازی لاجیت بر مبنای بهترین فرم تابع ریاضی، باعث شده است که مدل غیرخطی ارایه شده همانند مدل ناپارامتریک مدل ناپارامتریک همسانی واریانس داشته باشد.

4-     مدل غیرخطی ارایه شده انعطاف پذیری مناسبی برای پیش‌بینی مشارکت زنان در بازار کار داشته و سازگاری لازم را جهت برآورد احتمال مشارکت زنان فراهم می‌کند.

5-     نتایج برآورد پیش‌بینی مدل مشارکت غیرخطی و ناپارامتریک متفاوت نتیجه شده است و پراکندگی چشم‌گیری بین داده‌های برآورد شده این دو مدل مشاهده شده است که با توجه به ضریب کارایی بیش‌تر مدل غیرخطی صحت برآورد آن از مدل ناپارامتریک بیش‌تر است. از این‌رو، مدل غیرخطی نسبت به مدل ناپارامتریک کاراتر است.

6-     بیش‌ترین اثر مثبت به ازای متغیر تحصیلات زن و بیش‌ترین اثر منفی نسبت به متغیر بچه زیر شش سال بر احتمال حضور زنان ایرانی در مدل غیرخطی پیشنهادی، حاصل گردیده است.



[1]Mincer

[2] Cynthia

[3] Beth

[4] Bianco and Martínez

[5] Maalouf and Trafalis

[6] Frolich

[7] Killingworth

[8] Fortin

[9] Lacroix

[10] Chiappori

[11] Donni

[12]Berulava

[13] Chikava

[14] Lechner

[15] Gerfin  

[16]Nawata  

[17] Gong  

[18] Soest

[19]García

[20]White

[21] Maalouf and Trafalis

[22] Confidence index

[23] Willmott and Matsuura

[24] Agreement Index

[25] Efficient Factor

[26] Durbin- Watson (DW)

[27] White

[28] Assaad and  El-Hamidi

[29] Lagrange Multiplier

[30]Bera and  Bilias

[31] Racine and Li  

منابع

-        سالنامه آماری کشور سال 1388، مرکز آمار ایران

-        کشاورز حداد، غلامرضا، باقری قنبرآبادی، مرتضی (1390). تحلیل احتمال مشارکت زنان شهری و روستایی ایران در بازار کار با استفاده از روش های اقتصادسنجی پارامتریک و ناپارامتریک. مجلهتحقیقاتاقتصادی، 97: 151-174.

-         Assaad, R., & El-Hamidi, F. (2002). Female labor supply in Egypt: Participation and Hours of Work. In Human Capital: Population economics in The Middle East. Ismail Sirageldin (Ed.).  London: I.B. Tauris

-         Bera, A. K., & Bilias, Y. (2001). Rao’s Score, Neyman’s C (α) and Silvey’s LM tests: An Essay on Historical Developments and Some New Results. Journal of StatisticalPlanning and Inference, 97:9-44.

-         Berulava, G., Chikava, G., 2012. The determinants of household labor supply in Georgia, France and Romania: a comparative study. Eurasian Journal of Business and Economics, 5 (9), 141-164.

-         Bianco, A.M., & Martínez, E. (2009). Robust testing in the logistic regression model. Computational Statistics and Data Analysis, 53: 4095-4105.

-         Chiappori, P.A. (1988). Rational household labor supply. Econometrica, 56: 63-89.

-         Chiappori, P.A. (1992). Collective labor supply and welfare. Journal of Political Economy, 100: 437-67.

-         Cynthia, B.L., & Beth, T.N. (1979). Theeconomics of six differentials. New York, Columbia University Press.

-         Donni O., & Moreau, N. (2007). Collective labor supply: A single-equation model and some evidence from French data. The Journal of Human Resources, XLII: 214-246.

-         Durbin J., & Watson, G.S., (1971). Testing for serial correlation in least squares regression III. Biometrika 58, 1–19.

-         Fortin, B., & Lacroix, G. (1997). A test of neoclassical and collective models of household labor supply. Economic Journal, 107: 933-955.

-         Frolich, M. (2006). Non-parametric regression for binary dependent variables.Econometrics Journal, 9: 511–540.

-         García, J., & María J. S. (2002). Female Labor Supply in Spain: The Importance of Behavioural Assumptions and Unobserved Heterogeneity Specification. Department of Pampeu Fabra.

-         Gerfin, M. (1996) .Parametric and semi-parametric estimation of the binary response model of labor market participation. Journal of Applied Econometrics, 11:321–39.

-         Gong, X., & van Soest, A. (2000). Family structure and female labour supply in Mexico City. IZA Discussion, Paper No: 214.

-         Killingworth, M.R., & Heckman, J. (1986). Female labor supply: a survey, chapter 2 in orley Ashenfelter and Richard Layard eds, Handbook of Labor Economics. Vol. 1: New York: Elsevier Science Publishers Bv, 103-204.

-         Leckner, M. (1991). Testinglogit models in practice. Empirical Economics, 16(2), 177-198.

-         Maalouf, M., & Trafalis, T.B. (2011). Robust weighted kernel logistic regression in imbalanced and rare events data. Computational Statistics and Data Analysis, 55:168-183

-         Mincer, J. (1962). Labor Force Participation of Married Women: A Study of Labor Supply. Aspects of Labor Economics, Princeton, N.J.: National Bureau of Economic Research, Princeton University Press, 63-105.

-         Nawata, K. (1995). Estimation of the sample-selection models by the maximum likelihood estimator and Heckman’s two-step estimator. Economic Letter, 45:33–40.

-         Racine, J., & Li, Q. (2004). Nonparametric estimation of regression functions with both categorical and continuous data. Journal of Econometrics, 119: 99–130.

-         White, H. (1982). Maximum likelihood estimation of misspecified Models. Econometrica, 50:1-25

-         Willmott, C.J., & Matsuura, K. (1998). On the use of dimensioned measures of error to evaluate the performance of spatial interpolators. International Journal of Geographical, 86: 121-136.