مدلسازی توزیع درآمد برای ایران: مقایسه الگوی داگوم با چند مدل منتخب

نوع مقاله: مقاله پژوهشی

نویسندگان

1 استاد دانشگاه آزاد اسلامی واحد خوراسگان

2 کارشناس ارشد اقتصاد

چکیده

هدف این پژوهش برآورد مدل‌های دوپارامتری وایبل و سه پارامتری بتا، لگ ‌نرمال، گاما و داگوم به روش حداکثر درست‌نمایی (MLE) به صورت سالانه با استفاده از اطلاعات مربوط به هزینه و درآمد خانوارهای ایرانی برای سال‌های 1390-1361 به وسیله زیر‌برنامه محاسبه‌گر بسته‌ی VGAM در نرم افزار R بوده است. مقایسه برازش مدل‌های یاد شده به وسیله معیار اطلاعات آکائیک (AIC) صورت گرفته است. نتایج نشان می‌دهد. در دوره‌ی1390-1361 با وجود فراز و نشیب‌های مقادیر این شاخص در میان خانوارهای کشور، میزان ضریب جینی روندی کاهنده داشته یعنی در واقع شدت نسبی نابرابری درآمد در کشور کاهنده، ولی میزان کاهش آن بسیار محدود بود. هم‌چنین براساس معیار اطلاعات آکائیک و هم‌چنین نمودارهای حاصل از توابع چگالی احتمال مشخص شد که تابع توزیع داگوم یک برازش‌گر خوب است. مقادیر برآورد شده پارامترهای بتا و دلتا در طول این سال‌ها روند صعودی و پارامتر آلفا روند نزولی دارد.

کلیدواژه‌ها


1. مقدمه

در سال 1970 کامیلو داگوم[1]در جستجوی یک مدل آماری دقیق و درخور از توزیع درآمد تجربی و توزیع ثروت، کار خود را آغاز کرد. استفاده از توزیع‌های کلاسیک توزیع پارتو (توسعه یافته توسط اقتصاددان و جامعه شناس ایتالیایی ویلفردو پارتو[2] در اواخر قرن 19 (پارتو، 1895، 1896، 1897) و توزیع لگ نرمال (توسط مهندس فرانسوی رابرت گیبرات[3] (1931) برای چنین داده‌هایی کافی نبود. داگوم در جستجوی یک مدل انعطاف‌پذیر با دم سنگین در توزیع‌های ثروت و درآمد تجربی بود. پژوهش‌هایی با تغییر توزیع لگ- لجستیک (داگوم، 1990) و تعمیم توزیع قبلی به وسیله فیسک[4] (1961) انجام شده بود، داگوم متوجه شد که یک پارامتر اضافی مورد نیاز است. این موضوع به توزیع داگوم نوع I، یک توزیع سه پارامتری و تعمیم چهار پارامتری منجر شد (داگوم، 1990 و 1980). داگوم در سال 1989، برای واحد‌های اقتصادی با  ثروت خالص منفی، مدل تک پارامتری لاپلاس را مورد بررسی قرار داد. از تلفیق (ترکیب محدب) مدل نوع دوم داگوم و مدل تک پارامتری لاپلاس، داگوم مدلی به دست آورد که قابلیت کاربرد برای توزیع ثروت خالص با برد  را دارد. این خصوصیتی است که به مدل داگوم برجستگی خاصی می‌دهد زیرا دیگر مدل‌ها عموماً از این قابلیت محروم می‌باشند. در پژوهش حاضر، همانند بسیاری از بررسی‌های توزیع درآمد در کشورهای در حال توسعه، از هزینه‌های مصرفی به جای درآمد استفاده شده است بنابراین با توجه به این موارد این پژوهش درصدد است تا  مدل داگوم را با مدل‌های دوپارامتری وایبل و سه پارامتری بتا، لگ‌نرمال، گاما بر اساس معیار اطلاعات آکائیک (AIC) مقایسه و پارامترهای آن را به روش حداکثر درست‌نمایی برآورد کند.

 

2. ادبیات موضوع

چوتیکی پانیچ[5] و همکارانش (2010) و سورو[6] (1970) از مدل‌های سه پارامتری برای بررسی توزیع درآمدی رایج استفاده کردند نتایج نشان داد که توزیع سینگ- مادالا نیز نسبت به توزیع‌های دو پارامتری بهتر بوده و مورد استفاده قرار می‌گیرد. یافته‌های گرتل[7] و همکاران  (2000) نشان داد که تنها ریشه کن کردن بیکاری نمی‌تواند نسبت جینی را بهبود ببخشد، چون تاثیر آن به نسبت ضعیف است. تحقیقات آنها نشان داد که در طول دوره 2000-1992 پارامتر آلفا به میزان 54 درصد افزایش یافته است و پارامتر بتا به میزان 78 درصد کاهش داشته اما پارامتر دلتا 23 درصد افزایش داشته است. در نتیجه نسبت ضریب جینی به میزان 3/4 درصد افزایش خالص داشته است. در ایران نیز بررسی اهداف مرتبط با توزیع درآمد بعد از انقلاب اسلامی حاکی از آن است که سیاست‌گذاران و برنامه‌ریزان اقتصادی، در راستای سیاست‌های کلی نظام، سند چشم‌انداز بیست ساله کشور، قوانین برنامه‌های پنج‌ساله توسعه و قوانین سنواتی بودجه، مبنای فعالیت‌های خود را بر پایه رویکرد عمل‌گرایی و در جهت توسعه عدالت اجتماعی و توزیع درآمد و ثروت برای اقشار محروم قرار داده‌اند. از طرفی بیش‌تر مطالعات انجام شده در زمینه‌ی توزیع درآمد در ایران، بر اساس اطلاعات آماری گروه‌بندی شده است. به عبارتی دیگر، با طبقه‌بندی داده‎‌های حاصل از نمونه‌گیری در مناطق شهری و روستایی در گروه‌های چندگانه، شاخص‌های نابرابری متفاوتی محاسبه شده است.

بختیاری و همکاران (1380) با ارزیابی وضعیت هزینه‌های مصرفی مناطق شهری و روستایی استان اصفهان در دوره 72-1368 بیان کردند که انواع هزینه‌های مصرفی در طول این دوره افزایش  یافته است که این افزایش هزینه، در مناطق شهری با بدتر شدن وضعیت تغذیه‌ای همراه بوده است.  نتایج مطالعه ابونوری، خوشکار و حیدری (1385) و خسروی نژاد (1391) حاکی از آن است که نابرابری در مناطق روستایی از مناطق شهری بیش‌تر بوده است. نابرابری در مناطق شهری و روستایی شهرستان بندر لنگه در سال انتهایی اجرای برنامه سوم توسعه اقتصادی- اجتماعی (1383) نسبت به سال ابتدای اجرای این برنامه (1379) افزایش یافته است. هم‌چنین ابونوری (1987) در رساله دکتری خود در دانشگاه کنت انگلستان، تحت عنوان تجزیه و تحلیل ریاضی‌آماری توزیع درآمد و اثر نفت بر نابرابری‌های اقتصادی در کشورهای عضو اوپک به نتایج مشابهی دست یافتند.

 

 

3. روش‌شناسی

برای یافتن توزیع مناسب داده‌های درآمد می‌بایست چند توزیع که شکلی مشابه توزیع تجربی داده‌ها دارند به داده‌ها برازش داده شود و با مقایسه‌ی آن‌ها توزیع مناسب داده‌ها را انتخاب کرد. برای این منظور لازم است با استفاده از روش‌های برآورد پارامترهای توزیع‌‌ها، مثل روش ماکسیمم درست‌نمایی، پارامترهای این توزیع‌ها را برآورد کرد. در بیش‌تر توزیع‌های متداول یا کلاسیک برآوردگر ماکسیمم درست‌نمایی پارامترها منحصر به فرد بوده و با مشتق‌گیری معمولی از تابع درست‌نمایی  یا تابع لگاریتم درست‌نمایی  نسبت به پارامتر  به دست می‌آید. برای تحلیل داده‌ها از نرم افزار R استفاده شده است. نرم‌افزار R به واسطه قابلیت‌های بالا، رایگان بودن آن و امکان دسترسی به توابع کتابخانه‌ای سایر محققان اقصی نقاط دنیا، در بین سایر نرم افزار‌‌های برنامه‌نویسی از جایگاه خاصی برخوردار است.(هژبرکیانی و مرادی، 1387) در این قسمت به بررسی پنج تابع توزیع درآمدی داگوم، بتا، گاما، لگ نرمال و وایبل پرداخته می‌شود، و سپس به نحوه برآورد پارامترهای هریک از توابع به روش حداکثر درست‌نمایی[8] اشاره می‌شود.

داگوم با ارایه یک توصیف نظری و براساس ویژگی‌های مشاهده شده و برگیری از کشش درآمدی، یک تابع توزیع خاصی معرفی نمود. به طور کلی، کشش درآمدی از تابع توزیع تجمعی(CDF) با توجه به نقطه آلفا (α) از F(x)، به عنوان یک تابع کاهشی یک‌نواخت از F(x) است. نمایش ریاضی این استدلال، معادله دیفرانسیلی با سه یا چهار پارامتر به صورت زیر است:

(1)                                         

با حل این رابطه برای CDF خواهیم داشت

(2)                                   

که با مشتق‌گیری از  F(x)، تابع چگالی احتمال (Pdf)، f(x) به دست می‌آید:

 

که معادله (2) ، برای های بزگتر از صفر تعریف شده است (داگوم، 1977).

سه نسخه از مدل داگوم برای محاسبه مفروضات خاص در مورد جمعیت دریافت کننده درآمد وجود دارد.

داگوم رابطه (1) از تابع توزیع تجمعی (CDF) مربوط به مبداء زمانی که =0α، که این حالت نشان دهنده بهترین وجه رفتار دستمزد بگیران (افراد شاغل) است.

(3)                                                                                    

از آنجا که  =0α است داگوم نوع اول شامل سه پارامتر است که توصیف و توزیع با دریافت کنندگان درآمدی که درآمد صفر دارند (هیچ درآمدی دریافت نمی‌کنند) شروع می‌شود. پارامترهای β و δ مقیاس‌های آزاد هستند که مقدار برابری را توضیح می‌دهد (داگوم، 1983).

داگوم نوع (2) و (3) که شامل پارامتر چهارم α است که معنای اقتصادی ویژه‌ای دارد، پس معادله زیر

(4)                                                                                  

شامل چهار پارامتر تابع توزیع تجمعی است. برای داگوم نوع دوم 1> α>0 تعریف می‌شود که واحد سنجش درآمدی α با درآمد صفر یا منفی است. بنابراین α پارامتر نابرابری است، در حالی که λ پارامتر مقیاس است که به زمان و یا مقایسه فاصله توزیع درآمد در واحدهای مختلف پولی بیان شده است. داگوم نوع سوم مختص توزیع درآمد نمونه از دریافت کنندگان کل درآمد (دستمزد بگیران به علاوه کسانی که از اموال خود درآمد به دست می‌آورند) است. به این دلیل که درآمد جمع آوری شده از جمعیت، با درآمد اولیه مثبت آغاز می‌شود. بنابراین نسبت جینی مرتبط با مدل داگوم از طریق فرمول زیر محاسبه می‌شود:

(5)                                                             

           

که در آن  همان تابع گامای کامل مشخص شده در تابع داگوم است. نسبت جینی یک تابع فزاینده از α است بنابراین نسبت جینی مربوط به مدل داگوم با افزایش ارزش β و δ به صفر میل می‌کند که نشان دهنده برابری کامل است و با کاهش β و δ، تمایل به یک دارد که نشان‌دهنده نابرابری کامل است. به این معناست زمانی که ارزش β و δ افزایش می‌یابد، توزیع درآمد بهبود می‌یابد. (دانچلی، 1986) به طور خاص، با حرکت از قسمت مرکزی نمودار به سمت راست و به سمت انتهای بالایی نمودار،  به این مفهوم است که جمعی از افراد طبقه متوسط، درآمد بالاتری را دریافت می‌کنند، که این با افزایش ارزش δ، منعکس می‌شود [ 0]. به طور مشابه افزایش ارزش β، موجب بهبود رفاه مردم کم درآمد می‍شود [ 0]. پارامترهای بتا (β) و دلتا (δ) در معادله(5)، به طورخلاصه اطلاعاتی در مورد چگالی، یا توزیع فراوانی افراد در نیروی کار در سطوح مختلف درآمدی را نشان می‌دهد. در حقیقت با توجه به معادله (2)، با تغییر بتا (β) و دلتا (δ) و ثابت نگه داشتن پارامتر دیگری مشخص می‌شود که: i) هرگونه افزایش (کاهش) در بتا (β) با ثابت نگه داشتن دلتا (δ)، میزان برابری افزایش (کاهش) می‌یابد. هم‌چنین هرگونه افزایش (کاهش) در دلتا (δ) با ثابت نگه داشتن پارامتر بتا (β)، میزان برابری افزایش (کاهش) می‌یابد. ii) زمانی که بتا (β) و دلتا مخالف علامت هم هستند، اثر مشترک بتا (β) و دلتا (δ) به طور خلاصه موجب بهبود نسبی (زوال) در میزان برابری خواهد شد وقتی که بتا (β) افزایش (کاهش) می‌یابد و موجب زوال جزیی (بهبود) می‌شود زمانی که دلتا (δ) کاهش (افزایش) می‌یابد. بنابراین پارمترهای موجود در ضریب جینی به رفتار پارامترهای مهم برابری در اقتصاد، بستگی دارند.

توزیع وایبل یکی از مهم‌ترین توزیع‌ها در مسایل برنامه‌ریزی‌های اقتصادی و هم‌چنین در رشته مهندسی است. تابع تجمعی توزیع وایبل به صورت زیر است:

(6)                                                                 

که درآن  پارامتر مکان،  پارامتر مقیاس وp  پارامتر شکل می‌باشد. هم‌چنین تابع چگالی احتمال توزیع وایبل به صورت زیر می‌باشد:

(7)                                                  

 

متغیر تصادفی x دارای توزیع لگ نرمال است اگر log(x) دارای توزیع نرمال باشد. تابع چگالی احتمال برای متغیر تصادفی از توزیع سه پارامتری لگ نرمال به صورت زیر است

(8)                                       

    که در آن. پارامترهای ،  و  پارامترهای توزیع هستند. وقتی مقدار پارامتر  صفر باشد، توزیع سه پارامتری به توزیع دو پارامتری لگ نرمال تبدیل می‌شود.توزیع سهپارامتری لگ نرمال به وسیله یوان (1933)، کوهن (1951)، هیل (1963)، هارتر و موور (1966)، وینگو (1986) و ... مورد مطالعه قرار گرفته است.

تابع چگالی احتمال گاما با پارامترهای  ،  و  به صورت زیر است:

(9)                        

  که در آن   و  به ترتیب پارامترهای مکان، شکل و مقیاس هستند. در صورتی که تابع چگالی احتمال سه پارامتری گاما به صورت اریب منفی باشد در این صورت تابع چگالی احتمال را برای این توزیع می‌توان به صورت زیر نوشت:

(10)

 

که  در  آن   می‌باشد. بنابراین پارامترهای ،  و  به ترتیب پارامتر مقیاس، مکان و شکل هستند.          

 و در نهایت تابع چگالی احتمال توزیع بتای نوع دوم به صورت زیر می‌باشد:

(11)                                                            

که در آن می‌باشد.                                  

برآورد به روش حداکثر درست‌نمایی

داگوم (1977) در یک دوره زمانی وقتی اطلاعات فردی به ندرت در دسترس بودند، به صورت زیر حداقل سازی ‌کرد:

(12)                                                                      

معیار حداقل مربعات غیرخطی در فاصله بین تابع توزیع تجمعی (CDF)  تجربی و CDF تقریب زده شده از توزیع داگوم مبنا قرار گرفت. علاوه بر این نوع رگرسیون برآورد شده با استفاده از کشش رابطه (1) به بعد، توسط استوپا (1995) بررسی شد. امروزه اکثر محققان از برآورد حداکثر احتمال (ML) استفاده می‌کنند. دو مورد برجسته، داده های گروه‌بندی شده و داده‌های فردی مورد نیاز است. تا همین اواخر، تنها داده‌های گروه بندی شده در دسترس بود و احتمال  که در آن  یک احتمال چندجمله‌ای است با ( فرض داده‌های مستقل):

(13)                                                 

بنا به ساختار این احتمال همیشه از بالا کراندار است.

در نگاهی به سی‌امین سالگرد کمک‌های داگوم به نظر می‌رسد او دوباره یکی از نمونه‌های اولیه تجربی خود را برای درآمد خانوارهای آمریکایی در سال 1969 به خود اختصاص می‌دهد.

نمودار هیستوگرام استخراجی کریستین کلیبر از طریق برآورد تقریبی داگوم نوع یک به وسیله گروه‌بندی حداکثر احتمال را نشان می‌دهد. نتایج برآورد48/14 ، 273/4 و 36/0   است و این مقادیر سازگار با مقادیر برآورد شده به وسیله داگوم از طریق حداقل مربعات غیر خطی است.

با افزایش ریز داده‌های در دسترس، برآورد احتمال برای مشاهدات فردی توجه بیش‌تری را جلب می‌کند، و این وضعیت بیش‌تر مستلزم: لگ احتمال  یک نمونه کامل تصادفی از اندازه n هست:

(14)

 

بازده معادلات احتمال

(15)                                                  

(16)                                                                          

(17)                                                

که باید عددی محاسبه شوند.

با این حال، برآورد احتمال این خانواده بدون مشکلات نیست: با توجه به توزیع logX، توزیع لجستیک تعمیم یافته، شائو[9] (2002) نشان می‌دهد که ممکن است MLE وجود داشته باشد و اگر نداشته باشد، به اصطلاح مشکل مدل تعبیه شده رخ می‌دهد. اجازه دادن به پارامترهای خاص، که به مقادیر مرزی خود تمایل دارند، یک توزیع با پارامتر جزیی را به وجود می‌آورد. مفاهیمی هستند که رفتار احتمال باید برای آن‌ها به دقت در کار تجربی بررسی شوند. این امر می‌تواند جالب باشد که برای تعیین این که تا چه حد این اشکال، در برنامه‌های کاربردی از داده های درآمد که در آن انعطاف پذیری کامل خانواده داگوم مورد نیاز نیست، به وجود می‌آید.

ظاهراً غافل از این مشکلات، دومانسکی و یرژیچاک[10] (1998) یک مطالعه مشابه عملکرد MLE را ارایه کردند. به نظر می رسد که نمونه نسبتا بزرگ برای برآورد پارامترهای شکل   مورد نیاز بود، در حالی که برآورد قابل اعتماد از پارامتر مقیاس به نظر می‌رسد نیاز به نمونه‌های حتی بزرگ‌تر دارد.

روش‌های برآورد حداکثر درست‌نمایی برای تابع توزیع سه پارامتری گاما به وسیله جانسون و کوتز (1970)، کوهن و نورگارد (1977)، هارتر و موور (1965)، بوومن و شنتون (1988) و ... بیان شده است. بنابراین برای معادله احتمال گاما داریم:

(18)

 

   

                

که در آن   و  تابع سای است.

  اگر   متغیرهای تصادفی از توزیع بتا باشند در این صورت تابع لگاریتم احتمال برای این مشاهدات به صورت زیر خواهد بود:

(19)

 

با مشتق‌گیری نسبت به پارمترهای توزیع و برابر صفر قرار دادن این روابط خواهیم داشت:

(20)

 

 

 

4. یافته‌های تحقیق

در سال‌های 1361 تا 1390 بررسی هزینه و درآمد خانوارهای ایرانی در شهرهای مختلف و با مراجعه به خانوارهای نمونه‌گیری شده، انجام شده است. در سال‌ 1390، متوسط هزینه ناخالص سالانه یک خانوار ایرانی برابر 108344594 ریال گزارش شده است که نسبت به سال مبدا این پژوهش یعنی سال 1361 (متوسط هزینه ناخالص سالانه یک خانوار ایرانی برای این سال برابر 694428 ریال است) به میزان 107650166 ریال افزایش داشته است هم‌چنین متوسط تعداد افراد خانوار برای سال ابتدا این تحقیق کاهش 69/1 نفری نسبت به سال 1390 داشته است. شکل زیر روند حرکت مقادیر متوسط هزینه ناخالص سالانه یک خانوار ایرانی از سال 1361 تا سال 1390 را نشان می‌دهد.

 

شکل 1. میانگین هزینه متوسط هر خانوار

 

 

در مدل توزیع داگوم مقادیر پارامترهای  از روش حداکثر درست‌نمایی با استفاده از زیربرنامه محاسبه‌گر بسته‌ی [11]VGAM در نرم افزار R[12] به دست آمده است.           

 جدول (2) برآورد مقادیر آلفا، بتا و دلتا را با استفاده از معادله (4) برای نمونه‌ای از هزینه خانوار ایرانی برای سال‌های 1390-1361 و با استفاده از معادله پارامتری (5)، نسبت جینی به روش ماکسیمم درست‌نمایی را نشان می‌دهد.

در جدول (2) مقادیر مربوط به پارامترها و ضریب جینی برآورد شده که مقادیر مربوط به پارامتر آلفا بیانگر میزان نابرابری در بین سال‌های مورد مطالعه دارد، که در بین سال‌های 1361 و 1390 کم‌ترین میزان نابرابری مربوط به سال 1390 و بیش‌ترین میزان نابرابری مربوط به سال 1361 می‌باشد، همان طور که مشاهده می‌شود برای این سال‌ها ضریب جینی نیز به ترتیب کم‌ترین و بیش‌ترین مقدار را داراست و این حاکی از وجود رابطه مستقیم بین پارامتر آلفا و ضریب جینی دارد. هم‌چنین مقادیر مربوط به بتا که نشان دهنده میزان برابری است برای سال 1361 کم‌ترین و برای سال 1390 بیش‌ترین مقدار را داراست بنابراین از برآورد پارامترهای یاد شده مشخص می‌شود که توزیع درآمد در سال 1361 بسیار نابرابرتر از سال 1390 است که این نابرابری تقریباً به میزان 10 درصد در فاصله سال‌های مذکور کاهش داشته است. همچنین مقادیر حاصل از ، چون از عدد یک بزرگ‌تر هستند ، پس یک تابع توزیع حاصل تک نمایی خواهد بود.

جدول 2. برآورد پارامترهای مدل داگوم نوع دوم و ضریب جینی به روش ماکسیمم درست‌نمایی برای ایران در سال‌های 1390-1361

آماره    Kolmogrov-smirnov
مجموع مربعات خطا SSE(Pdf)
نسبت جینی (Gini ratio)

𝛃𝛅

برآورد پارامترها
سال

P-Value

K-S

Delta(𝛅)

Beta(𝛃)

Alpha(𝛂)

928/0

004/0

067/0

4921/0

9646/2

34670/5

58953/0

05881/0

1361

159/0

032/0

178/0

4807/0

8454/2

49399/3

81438/0

051192/0

1362

356/0

007/0

291/0

4638/0

0672/6

82073/3

58799/1

04798/0

1363

098/0

009/0

017/0

4706/0

5978/2

19441/2

18385/1

04932/0

1364

241/0

065/0

368/0

4571/0

1522/1

08816/1

05890/1

04638/0

1365

198/0

016/0

156/0

4330/0

3598/5

93171/2

82824/1

04565/0

1366

787/0

004/0

079/0

4195/0

1011/11

54506/4

44257/2

04248/0

1367

086/0

003/0

169/0

4309/0

2521/4

51737/2

68913/1

04606/0

1368

256/0

032/0

154/0

4227/0

2381/2

10309/1

02895/2

04358/0

1369

316/0

061/0

234/0

4171/0

1919/4

17328/2

92885/1

04156/0

1370

147/0

008/0

098/0

4034/0

7729/9

83209/3

55029/2

04012/0

1371

158/0

001/0

054/0

4012/0

923/11

56417/4

61240/2

03985/0

1372

279/0

013/0

066/0

4108/0

3787/2

02754/1

31498/2

04384/0

1373

356/0

077/0

119/0

4326/0

5845/2

48006/1

74623/1

04759/0

1374

784/0

002/0

256/0

4094/0

7544/12

91288/4

59612/2

04102/0

1375

981/0

056/0

198/0

4240/0

0262/3

51099/1

00281/2

04523/0

1376

112/0

069/0

224/0

4185/0

5965/3

44026/1

49717/2

04218/0

1377

075/0

004/0

125/0

4312/0

0713/2

23092/1

68279/1

04854/0

1378

061/0

010/0

023/0

4051/0

245/12

27901/4

86180/2

04112/0

1379

876/0

009/0

114/0

4149/0

4866/3

42148/1

45283/2

04398/0

1380

489/0

005/0

074/0

4208/0

5578/11

11981/6

88847/1

04687/0

1381

324/0

159/0

223/0

4065/0

3887/2

87188/0

73981/2

03979/0

1382

307/0

048/0

197/0

4113/0

0577/15

79075/5

60021/2

04226/0

1383

069/0

124/0

375/0

4087/0

3292/6

27966/2

77642/2

04002/0

1384

451/0

019/0

195/0

4119/0

5395/3

44089/1

45649/2

04512/0

1385

378/0

038/0

171/0

4057/0

9192/4

72354/1

85413/2

03974/0

1386

320/0

006/0

027/0

3995/0

4745/10

60923/3

90216/2

03895/0

1387

221/0

011/0

030/0

4073/0

5242/8

09496/3

75425/2

04127/0

1388

173/0

072/0

188/0

3941/0

0008/8

68898/2

97544/2

03842/0

1389

874/0

001/0

164/0

3907/0

8668/15

12073/5

09854/3

03799/0

1390

  منبع: یافته‌های محقق

 

بعد از برآورد ضریب جینی و پارامترهای فرم تابعی داگوم به معیارهایی برای تشخیص این که آیا مدل ما یک مدل مناسب برای برازش بوده یا نه، نیاز داریم، برای این منظور از دو آزمون مجموع مربعات خطا (SSE) و آزمون کلموگروف – اسمیرونوف (K-S) استفاده کردیم، در این تحقیق چون مقادیر مربوط به آماره K-S کم‌تر از آماره SSE است بنابراین آماره K-S یک انتخاب عالی برای تشخیص خوبی برازش برای مدل داگوم می‌باشد لازم به توضیح است منظور از مجموع مربعات خطا همان رابطه   است که در آن  مقادیر مشاهده شده و  مقادیر برآورد شده هستند. هم‌چنین آزمون کلموگروف– اسمیرونوف برای تطابق توزیع، احتمال‌های تجمعی مقادیر در مجموعه داده‌ها را با احتمال‌های تجمعی همان مقادیر در یک توزیع نظری خاص مقایسه می‌کند. اگر اختلاف آن به قدر کافی بزرگ باشد، این آزمون نشان خواهد داد که داده‌ها با یکی از توزیع‌های نظری مورد نظر تطابق ندارد. در این آزمون اگر معیار تصمیم     (P-value) کم‌تر از 5 درصد باشد فرض صفر رد می‌شود یعنی داده‌ها نمی‌توانند از یک توزیع خاص باشند همان ‌طور که در جدول (2) مشاهده می‌کنیم مقادیر مربوط به این آماره نشان از این دارد که مدل پیشنهادی داگوم در این تحقیق یک برازش‌گر خوب است.

برای یافتن توزیع مناسب داده‌های درآمد می‌بایست چند توزیع که شکلی مشابه توزیع تجربی داده‌ها دارند به داده ها برازش داده شود و با مقایسه‌ی آن‌ها توزیع مناسب داده‌ها را انتخاب کرد. برای این منظور لازم است با استفاده از روش‌های برآورد پارامترهای توزیع‌ها، مثل روش ماکسیمم درست‌نمایی، پارامترهای این توزیع‌ها را برآورد کرد. در بیش‌تر توزیع‌های متداول یا کلاسیک برآوردگر ماکسیمم درست‌نمایی پارامترها منحصر به فرد بوده و با مشتق‌گیری معمولی از تابع درست‌نمایی یا تابع لگاریتم درست‌نمایی نسبت به پارامترهای مورد نظر به دست می‌آید. لازم به ذکر است که برآورد پارامترهای خانواده‌ی توزیع گاما و بتا با استفاده از مشتق‌گیری معمولی قابل محاسبه نیست و باید با روش‌های عددی محاسبه شود، که از فرمان optim در نرم‌افزار R استفاده می‌کنیم. بنابراین در این پژوهش توزیع داگوم را با چهار توزیع وایبل، بتا، گاما و لگ نرمال مقایسه می‌کنیم، با تو جه به این که پارامترهای مدل داگوم در قسمت اول برآورد شده‌اند در اینجا ما به برآورد پارامترهای چهار تابع توزیع دیگر با استفاده از روش حداکثر درست‌نمایی می‌پردازیم، سپس برای مقایسه پنج تابع توزیع با یکدیگر از معیار آکائیک استفاده می‌کنیم.

 

جدول 3. برآورد پارامترهای مدل‌های مختلف از روش حداکثر درست‌نمایی

توزیع

توزیع بتا

توزیع گاما

توزیع لگ نرمال

توزیع وایبل

پارامتر

     

b

               

1361

40/1

10/1

01/0

20/1

40/1

10/1

01/0

80/0

12/0

06/0-

40/1

50/1

1362

81/1

41/1

03/0

01/1

72/1

73/0

03/0

71/0

01/0

03/0-

71/1

41/1

1363

70/1

70/2

09/0

90/1

91/1

64/0

08/0

63/0

08/0

07/0-

43/1

80/1

1364

83/1

01/2

04/0

30/1

73/1

72/0

05/0

67/0

08/0

08/0-

72/1

41/1

1365

01/2

10/2

01/0

20/1

00/2

56/0

12/0

59/0

07/0

08/0-

90/1

30/1

1366

84/1

70/1

04/0

10/1

80/1

71/0

04/0

68/0

04/0

04/0-

71/1

43/1

1367

80/1

40/2

03/0

70/1

60/1

79/0

03/0

71/0

05/0

05/0-

60/1

41/1

1368

87/1

30/2

13/0

60/1

57/1

89/0

01/0

75/0

03/0

02/0

75/1

50/1

1369

92/1

20/2

05/0

40/1

91/1

66/0

06/0

63/0

12/0

09/0

81/1

40/1

1370

01/2

60/1

12/0

90/8

10/2

53/0

11/0

63/0

03/0

02/0

01/2

31/1

1371

90/1

90/1

09/0

20/1

01/2

57/0

08/0

59/0

10/0

01/0-

90/1

32/1

1372

01/2

20/1

11/0

10/1

13/2

88/0

11/0

63/0

48/0

05/0

10/2

90/1

1373

44/1

40/3

06/0

50/3

52/1

97/0

06/0

77/0

12/0

01/0-

60/1

64/1

1374

20/2

20/1

03/0

20/7

30/2

55/0

02/0

58/0

20/0

14/0-

80/1

40/1

1375

31/1

10/1

07/0

40/1

44/1

20/1

07/0

81/0

18/0

03/0-

50/1

70/1

1376

80/1

80/1

09/0

30/1

76/1

74/0

09/0

71/0

05/0

01/0

82/1

52/1

1377

00/2

30/2

06/0

40/1

92/1

64/0

06/0

64/0

09.0

06/0-

85/1

40/1

1378

93/1

50/1

07/0

10/1

87/1

75/0

07/0

65/0

18/0

08/0-

74/1

53/1

1379

20/1

9/7

06/0

80/4

20/2

59/0

06/0

58/0

22/0

12/0-

9/1

50/1

1380

0/2

20/2

11/0

30/1

70/1

72/0

12/0

66/0

10/0

04/0-

80/1

50/1

1381

02/2

90/1

08/0

60/5

00/2

59/0

07/0

58/0

18/0

14/0-

86/1

41/1

1382

40/2

20/1

06/0

40/6

4/2

54/0

06/0

59/0

182/0

07/0-

00/2

49/1

1383

20/2

4/2

13/0

30/1

03/2

61/0

14/0

62/0

11/0

01/0-

03/2

50/1

1384

05/2

70/1

04/0

10/1

3/2

57/0

03/0

58/0

19/0

12/0-

90/1

40/1

1385

04/2

70/1

07/0

20/1

9/1

71/0

07/0

66/0

15/0

02/0-

93/1

52/1

1386

41/2

40/2

05/0

30/1

20/2

59/0

06/0

59/0

21/0

10/-

90/1

55/1

1387

90/1

03/1

12/0

33/1

04/2

63/0

12/0

60/0

17/0

04/0-

01/2

50/1

1388

01/2

30/1

08/0

40/8

10/2

61/0

08/0

61/0

15/0

05/0-

96/2

50/1

1389

80/1

60/1

17/0

10/1

90/1

62/0

17/0

63/0

07/0

01/0-

02/2

42/1

1390

70/2

90/1

09/0

70/7

80/2

39/0

09/0

52/0

09/0

07/0-

20/2

30/1

منبع: یافته‌های محقق

جدول 4. مقایسه برازش مدل‌ها

توزیع

         

سال

LLK*

AIC

LLK

AIC

LLK

AIC

LLK

AIC

LLK

AIC

1361

60/52-

34/105

77/52-

63/105

78/52-

65/105

77/52-

54/105

80/52-

8/105

1362

32/67-

64/134

80/67-

6/135

14/68-

28/136

70/68-

4/137

79/68-

5/137

1363

60/71-

32/143

98/71-

96/143

11/72-

22/144

54/72-

08/145

37/72-

7/144

1364

41/88-

04/183

67/88-

34/177

73/88-

46/177

55/88-

1/177

90/88-

8/177

1365

20/93-

44/186

39/93-

78/186

19/94-

38/188

80/93-

6/187

70/94-

4/189

1366

10/98-

22/196

51/98-

02/197

07/99-

14/198

68/98-

36/197

28/99-

5/198

1367

21/102-

42/204

49/102-

98/204

21/104-

42/208

08/104-

16/208

45/103-

0/206

1368

64/109-

28/219

97/109-

94/219

43/110-

86/220

20/110-

4/220

82/110-

6/221

1369

70/118-

4/237

06/119-

12/238

55/119-

1/239

83/119-

66/239

24/120-

4/240

1370

34/127-

68/254

95/127-

9/255

04/128-

08/256

45/128-

9/256

70/128-

4/257

1371

60/134-

2/269

83/134-

66/269

67/135-

34/271

09/135-

18/270

19/135-

3/270

1372

81/142

62/285

99/142-

98/285

45/143-

9/286

38/143-

76/276

66/143-

3/287

1373

32/152-

64/302

80/151-

6/303

23/152-

46/304

65/152-

3/305

07/153-

1/306

1374

41/166-

82/332

72/166-

44/333

24/167-

48/334

44/167-

88/334

86/167-

7/335

1375

65/178-

3/357

69/178-

38/357

80/187-

6/357

77/178-

54/357

03/179-

0/358

1376

24/189-

48/378

75/189-

5/379

07/190

14/380

91/189-

82/379

55/189-

1/379

1377

73/197-

46/395

08/198-

16/396

84/198-

68/390

55/198-

1/397

76/197-

5/397

1378

22/208-

44/416

61/208-

22/417

08/209-

16/418

79/208-

58/417

11/209-

2/418

1379

34/221-

68/442

86/221-

72/443

74/222-

48/445

97/221-

94/443

04/222-

0/444

1380

65/237-

3/475

88/237-

76/475

42/238-

84/476

09/238-

18/476

47/238-

9/476

1381

31/244-

62/488

56/244-

12/489

87/244-

74/489

51/244-

02/489

75/244-

5/589

1382

91/258-

82/517

11/259-

22/518

74/259-

48/519

42/259-

84/518

66/259-

3/519

1383

12/273-

24/546

20/273-

4/546

88/273-

76/574

50/273-

547

01/274-

0/548

1384

75/289-

5/579

81/289-

62/579

27/290-

54/580

12/290-

24/580

53/299-

0/581

1385

44/307-

88/614

85/307-

7/615

94/307-

88/615

82/307-

64/615

10/308-

2/616

1386

52/316-

04/636

79/316-

58/633

23/317-

46/634

08/317-

16/634

61/317-

2/635

1387

22/328-

44/656

57/328-

14/657

13/329-

26/658

84/328-

68/627

06/329-

1/658

1388

37/341-

74/682

82/341-

64/683

28/342-

56/684

12/342-

24/684

55/342-

1/685

1389

41/367-

82/734

77/367-

54/735

09/368-

18/736

27/368-

54/736

19/368-

3/736

1390

72/385-

44/771

02/386-

04/772

71/386-

42/773

59/386-

18/773

75/386-

5/773

منبع: یافته‌های محقق. *منظور از LLK همان loglikelihood است.

جدول (4) شامل مقادیر توابع احتمال لگاریتمی (عنوان loglikelihood در جدول (4) برای تمام سال‌ها و تمام توزیع‌های مورد بررسی همراه با ارزش آمار معیار آکائیک (AIC) که به صورت زیر تعریف شده است:

 

(مقدار LLK) * 2 - (تعداد پارامترها) * 2 = معیار آکائیک (AIC)

با توجه به جدول برازش مدل‌ها مشاهده می شود که تمامی مقادیر AIC تقریباً مشابه هستند ولی ارزش تابع توزیع داگوم در تمام سال‌های مورد تجزیه و تحلیل، کمتر از بقیه توابع توزیع است. بنابراین می توان نتیجه گرفت که تابع توزیع داگوم به عنوان بهترین برازش‌گر در بین توابع مختلف توزیع برای ایران است.

می‌توان به این نتیجه دست یافت که تابع توزیع داگوم برای همه سال‌های مورد بررسی مقدار بزرگ‌تری از تابع چگالی احتمال را نسبت به توابع توزیع بتا، گاما، لگ نرمال و وایبل نشان می‌دهد بنابراین این موضوع که مدل داگوم مقدار بزرگ‌تری برای ضریب جینی در همه سال‌ها نسبت به سایر مدل‌ها نشان می‌دهد با استفاده از این نتایج مورد تایید قرار می‌گیرد، هم‌چنین همان ‌طور که از شکل‌های بالا قابل مشاهده است هم‌چنین نتایج نشان داد که نابرابری درآمدی در سال 1361 به مراتب بیش‌تر از سال 1390 بوده است. بنابراین تابع چگالی احتمال داگوم برای همه سال‌ها بالاتر از تابع چگالی احتمال بتا، گاما، لگ نرمال و وایبل است.

 

5. نتیجه‌گیری

با توجه به این که آمار یکی از مهم‌ترین علوم کاربردی است که با سایر رشته‌های علمی از جمله اقتصاد مرتبط می‌باشد. از این رو، در سال‌های اخیر، علاقه زیادی برای تحقیقات در زمینه مدل‌های پارامتری توزیع درآمد به وجود آمده است. مدل‌های احتمال مربوط به توزیع درآمد، برای ارزیابی استانداردهای سطح زندگی کل مردم یک کشور و هم‌چنین برای مقایسه استاندارد سطح زندگی طبقات اجتماعی و یا مناطق مختلف یک کشور ارایه شده‌اند. بنابراین برای ایجاد یک مدل احتمال ارایه یک تابع توزیع نظری با مشخصه توزیع فراوانی تجربی برای انتخاب روش مناسب تخمین پارامترهای مدل، ضروری است. بنابراین تجزیه و تحلیل آماری توزیع درآمد جمعیت نشان دهنده زمینه لازم برای تصمیم‌گیری در مورد بودجه و سیاست‌های اجتماعی است (باستوروف 2006) با توجه به این موارد مدل پیشنهاد شده داگوم بسیاری از خواص مربوط به توزیع در آمد همانند خصوصیات رفتاری مدل در چارچوب اقتصادی، هم‌گرایی به قانون پارتو و اهمیت اقتصادی پارامترها، را برآورد می‌کند. (لاتوره 1989) از این مدل هم چنین برای تشریح توزیع اندازه مشارکت در کسب و کار نیز به صورت کاملاً موفق استفاده شده است. مدل داگوم موفقیت‌های زیادی را در مطالعات انجام شده بر روی توزیع درآمد و دستمزد و هم‌چنین توزیع ثروت به دست آورده است که مشخصات و ویژگی‌های این مدل به طور گسترده‌ای توسط نویسندگان مختلف تجزیه و تحلیل شده است. (کلیبر و کوتز 2003)  بنابراین در دنیای برابری کامل، هر یک درصد افزایش در جمعیت انباشته، سبب افزایش یک درصد درآمد انباشته می‌شود. تجزیه و تحلیل نظری و تجربی بر روی توزیع درآمد نشان داده‌اند که نرخ رشد درآمد حاصل از درآمد تجمعی سریع‌تر از نرخ رشد جمعیت دریافت کننده درآمد افزایش می‌یابند. و این بدان معناست که کشش درآمد تجمعی کاهش می‌یابد (داگوم 1990).

هدف از این پژوهش تحلیل نابرابری درآمد برای ایران به روش پارامتریک با استفاده از مدل داگوم و مقایسه تابع توزیع داگوم با توابع توزیعی چون بتا، گاما، لگ نرمال، و وایبل بود. نتایج حاصل از این پژوهش بر اساس برآورد ضریب جینی و پارامترهای توابع توزیع با استفاده از روش حداکثر درست‌نمایی در بین سال‌های 1361 تا 1390 نشان دادند که نابرابری درآمدی در ایران در بین سال‌های 1361 و 1390 در حال نوسان بوده است. در یک نتیجه‌گیری کلی از مقادیر ضریب جینی در کشور نتیجه گرفته می‌شود که در دوره‌ی 1390-1361 با وجود فراز و نشیب‌های مقادیر این شاخص در میان خانوارهای کشور، میزان ضریب جینی روندی کاهنده داشته یعنی در واقع شدت نسبی نابرابری درآمد در کشور کاهنده، ولی میزان کاهش آن بسیار محدود بود. هم‌چنین براساس معیار اطلاعات آکائیک و هم‌چنین نمودارهای حاصل از توابع چگالی احتمال مشخص شد که تابع توزیع داگوم یک برازش‌گر خوب است. مقادیر برآورد شده پارامترهای بتا و دلتا در طول این سال‌ها روند صعودی و پارامتر آلفا روند نزولی دارد.



1 Camilo Dagum

2 Vilfredo Pareto

3 Gibrat

4 Fisk

5 Chotikapanich

6 Thurow

[7] Gertel

1 Maximum Likelihood Method

1 Shao

2 Domanski and Jedrzejczak

1 Vector Generalized Linear and Additive Models (VGAM)

 [12]بنیان‌گذاران پروژه R آقایان Ross Ihaka و Robert Gentelman بودند. وجه تسمیه این زبان نیز ابتدای نام این دو نفر است.

منابع

-         ابونوری، اسمعیل، خوشکار، آرش، حیدری، حسین (1385). بررسی تحولات توزیع درآمد در شهرستان بندر لنگه طی برنامه سوم توسعه اقتصادی- اجتماعی. مجموعه مقالات اولین همایش توسعه شهرستان بندر لنگه قابلیت و راهکارها،  دانشگاه آزاد اسلامی واحد بندر لنگه.

-         بختیاری، صادق، نصراللهی، خدیجه، عمادزاده، مصطفی (1380). تحلیلی از وضعیت توزیع درآمد (هزینه) در استان اصفهان (72 - 1368). برنامه و بودجه، 6 (9 و 10): 81 – 51.

-         خسروی‌نژاد، علی اکبر (1391). برآورد فقر و شاخص‌های فقر در مناطق شهری و روستایی، فصلنامه مدل‌سازی اقتصادی، 6 (2): 39-60.

-         هژبر‌‌کیانی، کامبیز، مرادی، علیرضا (1387). نرم افزار R: محیط برنامه‌نویسی برای تحلیل‌های اقتصادسنجی و سری‌های زمانی،  فصلنامه مدل‌سازی اقتصادی،2 (5): 163-186.

-        Abounoori, E. (1987). Mathematico-statistical analysis of distribution of income and effect of oil on economic inequality within OPEC countries.

-        Bartosova, J. (2006). Logarithmic-normal model of household income distribution in the Czech Republic after 1990. Forum statisticum slovacum, Slovak Statistical and Demographical Society, Bratislava, 3: 3-10.

-        Chotikapanich, D. W. E., & Griffiths, D. S. P., & Valencia V. (2010). Global income distributions and inequality, 1993 and 2000: Incorporating country-level inequality modeled with beta distributions. Forthcoming in the review of economics and statistics.

-        Cohen, A. (1951). Estimating parameters of logarithmic normal distributions by maximum likelihood, Journal of the American Statistical Association, 46: 206-212..

-        Dagum, C. (1983).Income distribution models, in S. Kotz, N. L. Johnson and C. Read (eds.) Encyclopedia of Statistical Sciences, vol. 4, JohnWiley, New York.

-        Dagum, C. (1990). Generation and properties of income distribution functions. In C. Dagum and Zenga, Eds. Income and wealth distribution, inequality and poverty, Heildeberg, Springer Verlag.

-        Dancelli, L. (1986). Tendenza alla massima ed alla minima concentrazione nel modelo di distribuzione del redito di Dagum. In Scritti in Honore di Francesco Brambilla, 1:  249-267.

-        Domanski, C., & Jedrzejczak, A. (1998). Maximum likelihood estimation of the dagum model parameters. International Advances in Economic Research, 4: 243–252.

-        Fisk, P. R. (1961). The graduation of income distributions. Econometrica, 29:171–185.

-        Gertel, H. R., & Giuliodori, R. F., & Rodríguez, A., & Paula F. A. (2001). Unemployment and income distribution analysis: New evidences using a agum Parametric income distribution model, facultad de ciencias económicas, reunión annual de la aaep, buenos aires.

-        Gibrat, R. (1931). Les inegalites économiques, Paris, librairie du recueil sirey.

-        Harter, H.L., & Moore, A.L. (1966).  Local-maximum-likelihood estimation of the parameter of three-parameter lognormal population from complete and censored samples, Journal of the American Statistical Society, 61: 842—851.

-        Hill, M.B. (1963). The three-parameter log-normal distribution and bayesian analysis of a point-source epidemic.  Journal of the American Statistical Association, 58: 112-120.

-        Kleiber, C. & Kotz, S. (2003). Statistical size distribution in economics and actuarial sciences, London: Cambridge University Press.

-        Kotz, S., & Johnson, N.  L., & Read, C. (1983).  Encyclopedia of statistical sciences, John Wiley, New York.

-        Latorre, G. (1989). Asymptotic distributions of indices of concentration: Empirical erification and application, in: Studies in contemporary economics. income and wealth istribution, inequality and poverty, C. Dagum, M. Zenga (Eds), Springer- Verlag, Berlin.

-        Latorre, G. (1988). Propriet`a campionarie del modello di dagum per la distribuzione dei redditi, Statistica, 48: 15–27.

-        Majumder, A., & Chakravarty, S. R. (1990). Distribution of personal income: Development of a New Model and Its Application to US Income Data. Journal of Applied Econometrics, 5: 189–196.

-        Pareto, V. (1895). La legge Della domanda, giornale degli economisti, 10: 59-68. English translation in rivista di politica economica, 87: 691–700.

-        Pareto, V. (1897) Cour's d’Economie Politique, Rouge, Lausanne.

-        Shao, Q. (2002). Maximum likelihood estimation for generalised logistic distributions, Communications in Statistics: Theory and Methods, 31:1687–1700.

-        Stoppa, G. (1995) Explicit Estimators for income distributions, in c. dagum and a. lemmi (eds.) research on economic inequality, 6: Income Distribution, Social Welfare, Inequality and Poverty, Greenwich, CT: JAI Press.

-        Thurow, L. C. (1970). Analyzing the American income distribution. American Economic Review, 48: 261-269.

-        Wingo, D. R. (1984). Fitting Three-parameter log-normal models by numerical global optimization – an improved algorithm, Computation Statistical Data Analysis.

-        Yuan, P. (1933). On the logarithmic frequency distribution and semi-logarithmic correlation surface, annals of mathematical statistics.

-        Zelterman, D. (1987). Parameter estimation in the generalized logistic distribution, Computational Statistics & Data Analysis, 5: 177–184.