首頁 > 文章中心 > 正文

          城鎮居民教育收益率及分布

          前言:本站為你精心整理了城鎮居民教育收益率及分布范文,希望能為你的創作提供參考價值,我們的客服老師可以幫助你提供個性化的參考范文,歡迎咨詢。

          城鎮居民教育收益率及分布

          一、教育收益率的長期變動趨勢

          教育收益率是大量經濟學家所共同關注的一個重要問題。教育收益率的高低對于理解勞動力市場上的工資決定機制以及人們的人力資本投資行為(顯然,教育是人力資本形成的重要途徑)都具有非常重要的意義。在我國經濟轉型與改革過程中,對教育收益率的考察將具有更為特殊的意義,教育的投資收益不僅反映了人力資本的回報特征以及由此導致的人力資本投資行為,更為重要的可能在于為我國當前居民收入差距不斷擴張的趨勢性特征是否具有某種合理性提供經驗上的證據支持。在經濟轉型過程中,我國居民收入差距不斷擴張,這其中的原因是復雜的,但對原有分配體制的矯正無疑是一個重要的解釋性原因,這種體制矯正的一個重要現就在于收入決定中更加強調具有生產性功能的要素貢獻,包括教育在內的人力資本獲得更為充分的回報。在估計我國教育收益率的文獻中,大體上都認為改革開放之初,教育收益率是非常低的;但隨著改革深化,市場機制作用的增強,教育收益率具有不斷提高的趨勢,這可能是因為收入分配中更為強調教育等人力資本回報。從孫志軍(2004)總結的對我國城鎮居民明瑟收益率的18項研究中可以發現,經濟學家估計的20世紀80年代的教育收益率通常在3%左右;到90年代中期,大約為5%左右。張俊森等(Zhangetal,2005)、李實與丁賽(2003)還考察了教育收益率的長期變動趨勢特征,他們的研究結論大體上都顯示出,教育收益率有不斷升高的趨勢。①

          李雪松與Heckman(2004)在考慮了教育回報的異質性后發現大學階段的教育收益率為43%,大學四年的年均教育收益率大約為11%。張車偉(2006)對近年來教育收益率的估計方法與估計結果也進行了總結,本文不再對這些研究結果進行重復性說明。相對于已有的教育收益率的大量研究文獻,本文對家庭特征(父母背景)、工作單位特征(就業特征)以及教育質量等因素進行了控制,從而在一定程度上降低了教育收益率估計中可能存在偏差的某些因素的影響;此外,我們試圖利用分位回歸的分析方法討論教育收益率與收入分布之間的分布特征,因為在控制其他因素的情況下,收入條件分布的各分位點或許間接地測度了不可觀測的能力特征。

          二、估計方法討論

          明瑟方程是估算教育收益率的基本方法,以受教育程度和工作經驗來解釋收入水平:lnw=α+βSch+δ1Exp+δ2SExp+ε(1)其中,lnw示個人工資的對數,Sch示受教育程度(或受教育年限),Exp與SExp分別示(潛在)工作經驗以及工作經驗平方,ε為誤差項。估計系數β為不考慮教育成本時的教育收益率。明瑟方程在教育收益率的估計中具有非常重要的意義,同時也有大量的討論以此展開。這些討論中有的涉及到控制變量的選擇,有的涉及到估計方法的選取。最主要的是估計方程中缺乏對能力(ability)的度量。明瑟方程中,假定了所有人獲取教育的機會是相同的,如果不同的人的能力有差異,這種能力上的差異可能會影響到教育程度,也可能同時影響到收入水平。由于能力與教育、收入之間都具有相關性,因此對這一變量的省略(omitted)會導致教育收益率估計中的偏差,而且由于能力對教育以及收入都具有正向作用,這種偏差現為對教育收益率的高估。通常也有一些方法來糾正這種內生性偏誤,如引入能力的變量,如IQ測試等,但在我國的調查數據中一般都沒有相應的指標,同時也有研究明這種方式仍會導致OLS估計結果的上偏(HarmonandWalker,1995);利用雙胞胎信息,比較雙胞胎之間的教育水平與收入水平差異,由于雙胞胎可能是一個具有特殊性的群體,因此這一結果是否具有代性并推斷為總體特征可能仍會存有疑問;將能力視為不可觀測的固定效應,從而試圖通過面板數據的特征來消除其影響,但對于已經完成教育的大部分樣本來說,教育變量同樣構成了面板數據中的一個“固定效應”,只有未完成學業或再重新接受教育的樣本中才會出現教育變量的跨時期變化,而這兩類樣本也是具有極強的特殊性的;根據某些影響教育決策的外生事件構造“自然試驗”(naturalexperiment),如出生時間與入學的年齡規定;或者以父母或兄弟姐妹的教育程度作為控制變量等。教育收益率估計偏差的另一種來源是由于樣本選擇造成的。只有那些參與勞動力市場者才能觀察到他們的工資收入,而勞動力參與則是自我選擇的結果。能在多大程度上糾正這些偏誤已經成為教育收益率估計的方法論討論的重要內容。以上糾正能力偏差的思路強調的是以何種方式能最佳刻畫個體的能力特征。不過由于能力本身是難以觀測的,關于能力的度量也缺乏應有的理論基礎,因此現有的各種對所謂能力偏差的糾正方式只能明是得到了一個與OLS估計量不同的估計結果,但基準情形(benchmark)究竟是什么?并不容易確定,也就不能斷定哪個結果更為真實地刻畫了實際的教育回報特征。

          如果把控制能力特征后對教育收益率特征的估計理解為,對于給定的能力水平,教育與收入水平之間所現出的關系形式,并且如果高能力者能夠獲得較高的收入回報,則收入水平可以在較大程度上能力水平。①這一關系也可近似地理解為,對于不同的收入水平,教育與收入之間的關聯形式。這一思路可能與分位回歸(QR,quantileregression)的基本思想比較接近。分位回歸分析是由Koenker與Bassett(1978)所提出的,并逐漸獲得了越來越廣泛的應用。利用分位回歸,我們可以得到給定解釋性因素的條件下,收入分布的不同(條件)分位點上教育收益率的估計結果。除了前面所提到的這一方法在估計教育收益率中或許能有助于糾正能力偏差外,能夠給出估計參數的分布特征以及對異方差的糾正也是分位回歸的優良性質。一般說來,基于一系列經典假定,OLS估計量具有一些良好的統計性質,它是最優線性無偏估計量(BLUE),但這些經典假定有不被滿足的可能;此外,OLS估計量建立在均值回歸基礎上,假定估計參數在整個樣本區間內是相同的,并且誤差項也具有完全相同的分布特征。

          因此,OLS可以得到估計參數以及預測值的平均水平,但無法得到相關的條件分布特征。對于某些自變量來說,其回報率(即回歸參數)在不同的人群組中可能是不一樣的。一種簡單而直觀的處理方式是對人群組做出相應的劃分,但這種人為的分組方式是以因變量為基礎的,會導致因變量的分布被截斷(truncated)。分位回歸則能糾正這種截斷分布問題。遵循Buchinsky(1994)的思路,估計教育收益率的分位回歸模型可以寫為:lnwi=βθSchi+γθXi+uθi,且有Quantθ(lnwi|Schi,Xi)=βθSchi+γθXi其中,Quantθ(lnw/Sch,X)示給定Sch與X,lnw的第θ個條件分位點(conditionalquantile);βθ與γθ為分位回歸(QR)估計系數。參數βθ與γθ估計通過最小化絕對離差(LAD)來實現,即:(βθ,γθ)∈argmin∑{lnw≥βSch+γX}θ[lnw-(βSch+γX)]∑{lnw<βSch+γX}(1-θ)[lnw-(βSch+γX)]其中,0<θ<1,為所考慮的分位點。由最小化的一階條件可知,^βθ為滿足∑iSchi(θ-I)=0的解。相對于OLS估計量,Deaton(1997)指出分位回歸模型具有四個方面的優勢:可以在一定程度上克服異方差問題;能給出條件分布的大體特征,不同分位點下所給出的βθ與γθ本身也可能有值得進一步探討的意義;在擾動項分布非正態情形下,QR估計量有可能比OLS估計量更為有效;而且QR估計量更加不容易受到異常值的影響。

          三、數據描述

          本文數據來自于中國社會科學院經濟研究所收入分配課題組于2002年針對城鎮住戶所做的調查。本次調查共覆蓋12個省份的6835戶、總人口為20632人的城鎮樣本。調查工作由中外課題組設計調查問卷,國家統計局調查系統負責實施,所有調查樣本都來自于國家統計局的常規住戶調查樣本框。基于本文的分析目的,我們只選取了其中的部分樣本。首先,本文只考慮的是就業樣本,因此只包括16—60歲之間被雇傭的樣本,不包括自我經營者,也不包括在當年的失業經歷者。由于本文所考慮的一個重要方面是家庭特征對教育收益率的影響,在這一數據庫中,對家庭背景具有詳細登記的是父母信息。本次調查專門詢問了戶主與配偶的父母親基本信息,因此在樣本選擇時,只包括家庭戶主、配偶以及他們的子女,沒有包括其他家庭成員。這種選擇是否會造成教育收益率估計的偏差可能是不確定的。因為我國的戶主概念在更大程度上是與戶籍登記相一致的,并不完全對應于個人在家庭中的相對收入能力。①

          在本文所使用的樣本中,工資收入的分布特征如•a與•b所示。未經過對數轉換的工資分布圖現出了強烈的左偏態特征,經過對數化處理后,對數工資的分布仍現出偏態特征。②這種(對數)工資收入分布的非正態性意味著分位回歸可能更為合適。給出了不同受教育程度的年齡-工資關系曲線。顯然,在相同年齡組中,教育程度較高者的平均工資收入水平也相對較高,并且這種差距總體上隨著年齡的增長而進一步擴張,這意味著教育程度較高者不但具有相對較高的工資水平,也具有相對較高的工資增長速度。在教育收益率估計中,兩個最為重要的解釋變量是教育與工作經驗。與以往的研究類似,我們仍以受教育年限和教育程度來度量教育,前者是一個連續變量,后者是一個離散變量。對工作經驗的度量通常以“年齡-受教育年數-入學年齡”來度量潛在工作經驗,這也是國際文獻上通用的度量方法,但這與我國的工齡的連續計算方式是有差異的;另外如果受教育年限的數據中存在度量誤差,則也將導致推算的工作經驗的度量誤差。在2002年調查數據中,直接詢問了開始工作的年份,根據這一變量我們可以生成其工作經驗年數的變量。①本文根據開始工作的年份來生成工作經驗的變量。

          本文討論以擴展的明瑟方程為討論的起點。在擴展的明瑟方程中,除了受教育程度與經驗變量以外,還包括性別和中共黨員身份。本文中,受教育程度、收入水平的描述性統計量可見,受教育程度構成收入水平的解釋變量,其估計系數為教育程度的收益特征。中給出了各類控制變量的構成:父母背景中包括了父母的黨員身份、教育程度以及他們的職業類型;就業特征包括單位性質、所有制、職業性質以及所處的行業和省份等;此外,我們還以高中學校是否為重點學校、中學成績、上大學的途徑以及所在大學的排名評價度量教育質量。在擴展明瑟方程的基礎上,逐步加入父母背景、就業特征和教育質量等各類控制變量。與OLS估計相對應,分位回歸估計中也考慮不同的控制變量對教育收益率的影響,并試圖從教育收益率分布的變化中找出不同人群教育收益率差異的可能解釋因素。總體上說,在分位回歸中,我們所施加的三類控制變量仍為:家庭背景(父母狀況)、就業單位特征以及教育質量,以考察這三類變量是否會影響到不同分位點的估計系數差異,或對估計系數條件分布特征的影響。

          四、教育收益率的分布特征

          1•OLS回歸結果

          作為比較,我們首先給出OLS估計量。只給出了工資方程中教育變量的估計系數。從中可以看出,根據控制了性別與黨員身份的擴展明瑟方程,得到受教育年限的估計系數為0•0676,對這一估計系數以公式exp(b)-1進行折算,可以得到2002年城市居民每增加一年受教育程度導致工資水平上升大約7%左右。當增加新的控制變量后,教育年限的估計系數都有不同程度的下降。如果只控制某一類因素,則不難發現,當控制就業特征時,受教育年限的估計系數下降得最為明顯,增加一年受教育程度對工資收入的增長效應下降至0•0428(或對收入的貢獻率為4•37%),下降2•63個百分點;而控制父母背景受教育年限的估計系數影響則相對較小,受教育年限的估計系數下降至0•0622(或對收入的貢獻率為6•42%),下降0•58個百分點,相對下降幅度為8%左右。如果同時控制教育質量與就業特征,將導致受教育年限估計系數的更大幅度下降。在同時控制了父母背景、教育質量與就業特征這三類特征后受教育年限的估計系數下降了一倍以上,只有0•033(年收益率為3•36%)。考慮教育與收入關系的另一種重要方式是將受教育程度以離散形式度量。

          同時也給出了以小學文化程度為參照組,初中、高中/中專、大專與大學及以上四類受教育程度收益特征的估計結果。在擴展明瑟方程中,“大學及以上”的估計系數為0•86,也就是說,“大學及以上”受教育程度者的平均收入水平相對于初中文化程度者的平均收入水平要高出136%。①就總體趨勢來說,受教育程度的估計系數隨著控制變量的增加而逐漸下降,但不同類型的控制變量對于不同受教育程度的估計系數的影響并不相同。如果只考慮控制一類因素的情形,無論控制的是哪一類因素,“大學及以上”這一變量估計系數的變化是最為明顯的、變動幅度最大,增加一類控制因素將導致“大學及以上”的估計系數下降10個百分點左右。

          并且,這種控制變量增加導致受教育程度估計系數下降的幅度也是隨著受教育程度的上升而擴大的。對于受教育程度為“初中”者來說,增加新的控制變量對于其估計系數的改變并沒有明顯的影響,只是當控制就業特征時,“初中”變量的估計系數下降了0•024,而其他受教育程度變量的估計系數變動幅度都在0•1以上,其中“大學及以上”這一變量的估計系數下降了0•23。對于任意的受教育程度,因控制就業特征而導致的估計系數變化幅度都是最大的,這一方面說明就業特征對于居民收入水平的決定具有重要作用,另一方面也明教育的收益特征與就業狀況之間存在著密切的關系,這一關聯可能是由于勞動力市場分割特征造成的(張車偉,2006),或更進一步地是基于勞動力市場分割而造成的就業匹配質量差異形成的(邢春冰,2006)。如果控制兩類因素,則父母背景與就業特征的組合導致各受教育程度變量的估計系數下降幅度最大。如果同時控制三類因素,則初中組的估計系數下降0•04,是各組中下降幅度最小的;高中/中專、大專以及大學及以上分別下降0•15、0•22與0•32,隨受教育程度提升而依次下降的趨勢非常明顯。

          2•分位回歸結果

          我們以圖像形式展示分位回歸結果所顯示的是受教育程度在不同收入分布分位點的估計參數特征。給出的是以受教育年限度量的教育程度在不同分位點的估計系數。從中可以發現:教育年限的估計系數隨著分位點的上升而現出明顯下降的趨勢,并且這一趨勢并不隨著控制變量的變化而改變。這一變動特征與張車偉(2006)的結論剛好相反。張車偉(2006)發現教育回報率隨著收入水平的增高而上升。這一結論的出現可能與兩個方面的原因有關:一是在該文中城鄉樣本被混合使用,而城鎮居民的收入水平相對較高,并且多數的估計結果也顯示出城鎮居民收入決定中教育收益率也高于農村居民;二是其樣本只包括了上海、浙江與福建三個省份,或許樣本構成具有較強的特殊性。關于教育收益率估計的多數文獻中都強調對能力變量的忽略將會導致教育收益率的高估。如果這一結論能夠成立,則在分位回歸分析結果中,教育收益率將隨著分位點的上升而下降。因為越是在高收入組中,能力因素在收入決定中所起的作用可能會越強。沒有控制能力因素的OLS回歸結果上偏的可能性與幅度將會更大。此外,不同收入分位點上教育收益率變動趨勢的不同特征所引發的政策含義也是完全不同的。如果高收入分位點上教育收益率相對更高,則意味著教育擴展將會具有不斷加劇收入差距的效應;而如果教育收益率隨著收入分布分位點的上升而下降,則意味著教育擴張會有助于縮小居民收入差距。本文估計結果明,收入分位點越高,對應的教育收益率越低。這明,提高受教育程度,可能會更加有助于低收入階層的收入增長。

          總體上說,增加新的控制變量將導致各分位點上的教育收益率出現不同程度的下降,但這種變化并沒有改變收入條件分布的高分位點上對應的教育收益率較低的總體特征。是否控制就業特征,將會導致收入條件分布的不同分位點上所對應的教育收益率存在非常大的差異性。加入就業特征后,教育收益率曲線大幅度向下移動。這也就意味著,受教育程度的收益特征同時要受到就業特征的影響。而這一特征可能在較大程度上與我國勞動力市場的分割特征相關。由于勞動力市場是分割的,勞動力在不同類型單位之間缺乏充分的自由流動性,人力資本在不同就業單位之間的回報差異無法通過勞動力的自由流動實現均等化。控制父母背景導致收入條件分布不同分位點上教育收益率的差異變動幅度是非常小的。在這些被控制的父母特征變量中,包括了父母的人力資本特征(教育程度)以及社會政治資本等,但這些特征對于子女的教育收益率的影響并不明顯。需要說明的是,這些父母特征對于子女的教育收益率沒有非常重要的影響并不意味著這些因素在子女的收入決定中是不重要的。事實上,這些變量在子女收入函數中的聯合顯著性通常都是非常高的,大多在1%的水平上顯著。

          和給出的是以離散形式度量的各教育程度在收入條件分布不同分位點上的收益率特征,這里的教育程度參照組為小學及以下。為了便于比較,給出的是同一估計方程中,不同受教育程度在收入條件分布各分位點上的收益特征;而給出的是在施加不同控制變量的情形下,相同受教育程度在收入條件分布各分位點上的收益特征。從中可以看出,對于給定的參照組,較高受教育程度的收益率總是相對較高,但控制變量的差異將導致不同受教育程度收益率之間的差異幅度在不同分位點上有所差別。特別是在•7與•8中,在增加了相關控制變量后,不同受教育程度的收益率差異隨著收入條件分布分位點的上升而下降,這一特征也是與以受教育年限度量的教育收益率隨著收入條件分布分位點的上升而下降的基本趨勢相吻合的。從中也可以發現,控制了就業特征以后,“大專”與“大學及以上”教育程度在收入條件分布各分位點上的收益率也有較大幅度的下降,這一點也是與所揭示的特征相一致的。從圖像上看,當收入決定函數中施加了就業特征與教育質量等控制變量后,教育收益率隨著收入條件分布分位點上升而遞減的趨勢變得更加明顯,對于“大學及以上”文化程度來說尤其如此。這也意味著高等教育階段的收益特征受到就業以及教育質量①的影響要更為強烈。在教育收益率估計中,為了得到無偏的估計結果,一種比較傳統的做法是增加控制變量。

          給出了收入條件分布不同分位點上的教育收益率估計系數的變異系數。總體上說,控制變量的增加并沒有縮小不同分位點上教育收益率的變異系數值。也就是說,增加控制變量盡管會導致均值意義上的OLS估計量的變化,但對于改善估計系數的分布特征并沒有顯著的意義。特別是控制父母教育程度被認為是糾正能力偏差的選擇方式之一,但從本文中可以看到,控制父母背景后,各不同分位點上教育收益率的變異系數不僅沒有下降,而且有所上升。從這種意義上說,盡管控制父母教育程度會導致教育收益率估計系數的下降(見),但這種下降并不一定意味著是由于收入決定中的能力因素被剔除造成的。與所不同的是,與中所展示的離散形式的受教育程度的收益率隨著收入條件分布分位點上升而下降的趨勢性特征遠沒有明顯,受教育程度收益率與分位點之間的單調性關系也遠沒有所顯示的那么強烈。為了進一步檢驗教育收益率與收入條件分布各分位點之間的聯系,我們可以估計以下方程:βθ=δ0+δ×θ+ε(2)其中βθ為給定的收入條件分布θ分位點上所對應的教育收益率估計系數,則δ的估計值便可以度量教育收益率與收入條件分布分位點之間的聯系形式。給出了施加不同控制變量情形下的教育收益率的分位回歸結果與對應的分位點之間的關聯性。的估計結果明,基于受教育年限得到的教育收益率、“大專”以及“大學及以上”受教育程度在收入條件分布不同分位點上的估計值與分位點之間的統計關系非常顯著,教育收益率隨著收入分位點的上升而顯著下降。對于“初中”及“高中/中專”來說,一旦控制了就業特征,這兩個階段的教育收益率也現出與收入條件分布分位點的遞降傾向。比較不同控制變量對教育程度估計系數與分位點的關系的影響中可以看出,當控制就業特征后,收入條件分布各分位點對以“受教育年限”度量的教育程度的回歸系數的絕對值最低,即變化趨勢最為平緩,對于“大學及以上”文化程度的估計系數來說,也是如此。這就明,就業特征的引入降低了收入條件分布不同分位點之間的教育收益率差異。

          五、總結

          本文在控制影響收入的多種因素的基礎上,利用OLS與分位回歸分析方法討論了城鎮居民的教育收益特征,包括均值意義上的教育收益率以及收入條件分布不同分位點的教育收益率分布特征。本文的基本結論明:在收入條件分布較高的分位點上,所對應的教育收益率相對較低,即教育收益率隨著收入等級的上升而下降;另一方面,收入函數中引入不同類型的控制變量將會影響到平均的教育收益率估計水平,也在一定程度上影響到教育收益率的分布特征。在本文所考慮的控制變量中,就業特征對于教育收益率的影響最大,不僅影響到教育收益率的均值水平,也影響到教育收益率在收入條件分布不同分位點上的分布特征。這在一定程度上為勞動力市場分割提供了一種間接的經驗證據。就政策含義來說,盡管教育收益率可能成為我國居民收入差距擴張的一個重要解釋因素,但現有的情形并不明高收入者的教育回報也要高于低收入者,因此就其本身的意義來說,教育擴張仍將在更大程度上有助于低收入群體的收入增長,或者說教育擴展本身并不是導致收入差距擴張的原因。就業特征對于教育收益率的影響明,就業狀況或職業獲得應當成為收入分布研究的重要內容,因為相對于教育程度而言,就業特征與職業獲得可能是影響居民收入分布、導致收入差距擴張的更為重要的原因。