海纳百川
登录
|
登录并检查站内短信
|
个人设置
网站首页
|
论坛首页
|
博客
|
搜索
|
收藏夹
|
帮助
|
团队
|
注册
|
RSS
主题:
自由恋爱、赫克曼与自选择
海纳百川首页
->
罕见奇谈
阅读上一个主题
::
阅读下一个主题
作者
自由恋爱、赫克曼与自选择
云儿
[
博客
]
[
个人文集
]
游客
标题:
自由恋爱、赫克曼与自选择
(871 reads)
时间:
2002-12-08 周日, 下午12:11
作者:
Anonymous
在
罕见奇谈
发贴, 来自 http://www.hjclub.org
自由恋爱、赫克曼与自选择
○ 云儿
托克维尔那本《美国的民主》,虽说写于一百六十多年前,至今仍是政治
科学中不可不读的经典。在这本书中,托克维尔力求深入阐述民主制对美国人
的智力、感情、民俗、政治生活各个方面的影响。他的许多观察与说法,今天
读来颇出人意外,细品却别有韵味。
比如,托克维尔有个很好玩的观察:当时美国人在男女两性关系上的民情,
比其他任何地方都端庄正派。我们可以拿英国来作个对比:
“在英国,也象在欧洲其他一切国家一样,人们总是怀着恶意评论
妇女的弱点。人们经常听到哲学家和政治家叹惋民情不够正派,而文学
家也每天在这样虚构他们的作品。”
“在美国,所有的书刊,长篇小说也不例外,都把妇女构想为玉洁
冰清,没有人在书中讲述男女的风流韵事。”
为什么会有这种差别?托克维尔认为,单只是美国的国土、种族和宗教,
并不能完整说明差别的来源。一个更重要的原因在于,民主造就了身份的平等,
身份平等又导致门当户对的传统婚姻观念趋于衰落,促使人们因自由恋爱而结
婚。这使得婚姻忠贞,并且“毫无疑问能使民情容易正派和加速正派”。
象在别处一样,托克维尔在这里特别关心的,是如何抵御当时欧洲卫道士
们对民主制及其社会后果的抨击。自由恋爱正是一个极好的例子。他提到,在
欧洲人们观察到自由恋爱几乎都以悲剧收场,反对自由恋爱似乎有很强的事实
依据:
“我们的父辈对婚姻有过一种古怪的看法。由于他们见到当时刚刚
流行的少数恋爱结婚几乎都造成了悲剧的结局,所以断言这类事情听其
当事人的心意是极为危险的。在他们看来,萍水相逢可能比精挑细选还
好。”
然而,这类事实依据,其实什么也不能证明。托克维尔举出了两条理由。
第一,在一个敌视自由恋爱的社会里,逆潮流而动不仅导致与社会敌对,引起
孤立和痛苦,而且也缺乏自由择偶的必要知识与时间,婚姻自然不容易维持。
“因此,即使这样结婚的一对夫妻一开始就很不幸,而且后来还可能犯罪,那
也不应归咎于他们的自由选择,而应当归因于他们生活于其中的那个不许自由
选择的社会。”
他的第二个理由,属于本文要着重谈及的自选择问题----贵族制度下并不
是人人都有勇气追求自由恋爱的。那些敢于顶着社会压力而动的人,几乎都具
有固执、偏激、行事不计后果的性格。粗暴地阻止他不犯一般的错误,几乎总
是驱使他挺而走险。“凡是具有这种性格的人,不管他走到哪里,都很少能够
得到幸福和很少能够有善行。”很明显,这种性格下,十之八九都难以有美满
的婚姻。
然而这仅仅只说明偏激性格对美满婚姻不利,丝毫不说明自由恋爱本身对
美满婚姻不利。传统制度下自由恋爱与婚姻失败的联系,从统计上讲乃是抽样
偏差----即观察到的样本大都属于偏激性格----所致,并不反映事物的内在因
果联系。看不到此种样本偏差的存在,仅根据片面观察就推断出自由恋爱必定
不利于美满婚姻,在逻辑上可说是犯了“合举谬误(fallacy of composition)”,
即错误地不加分析地将那些只对个体有效的命题非法推广到全体。
在他的著作中,托克维尔对这类合举谬误,表现出了极强的直觉和深刻的
洞察。他的结论是:
“因此,在贵族制度时代,一个男人与一个女人萍水相逢,一见钟
情,除了个人的意见和爱好以外,其他一切条件都不考虑,就仓促结为
夫妻,而婚后不久就见异思迁而乱搞和出现悲剧,乃是无须惊奇的。但
是,如果这种结合能按事物的常规和自然秩序进行,受到社会情况的支
持,承认父母的权威,得到舆论的赞扬,则毫无疑问,家庭内部的和睦
将更加增加,夫妻间的忠贞将更好地得到遵守。”
有意思的是,谈到这类样本偏差时,托克维尔还顺便提了一下,“在一些
最必要的和最神圣的革命中之所以很少见到温和而稳健的革命家,其原因就在
于此。”由于这个道理,我们今天见到许多在逆境中苦苦奋斗的异议人士,许
多都具有择善固执的不妥协性格,其实毫不奇怪。一些网友有种倾向,总喜欢
由这些人士的某些作为,推断出中国实现民主后也会如何如何。其实这种推断,
大多(不是全部!)象当年欧洲贵族反对自由婚姻的理由一样,犯了无视样本偏
差的合举谬误。
* * *
托克维尔提到的那类样本偏差,在社会观察中几乎无所不在,很久以来一
直是个令研究者头痛的问题。政客和利益集团用统计调查数据蒙人,也都喜欢
在样本偏差上玩花样。记得在一九九九年,某功法团体曾大力宣传一份调查材
料,声称调查了上万名修练者,练功后各种疾病有不同程度好转者,达百分之
九十以上。然而在懂得样本偏差和自选择问题的人看来,就算这份调查材料百
分之百真实,从抽样到汇总各个环节都无半点虚假,其结论仍不足采信。
原因就在于,这份材料只调查了坚持练功的学员,未调查不练功的人,更
没有调查那些一度练功、发现无效而退出修练的人。没有这些资料作对照,我
们完全无法判断,修练者是因为练功才有疾病好转的呢,还是因为疾病好转才
坚持下来的?要知道,因好转而坚持,与因坚持而好转,两种情形看似区别细
微,其实有本质的不同。前者不过是纯粹的自选择,与修练的疗效,是毫无干
系的。
举个例子,我也可以自吹法力无边。任何人,只要每个月到我这儿登记一
下,什么功都不用练,只要他心诚,我就包他疾病好转、百毒不侵。假设很多
人信了我的话,跑来登记。以后疾病有好转的,继续登记;没有好转的,不再
登记。好转者留,不好者去。如此三年五载之后,调查一下留在我登记名单上
的人,准保百分之九十以上的人,在登记了之后,疾病都有有了不同程度的好
转。我再厚颜无耻一下,就可以拿此“科学调查“材料,作为我真的法力无边
的证据了。
这是自选择导致样本偏差的一个典型例子----当事人自行选择是否登记的
行为,决定了留在登记簿上的是什么人。
样本偏差的不可避免性,反映了社会科学与自然科学的分野之一。自然科
学中不少属于实验科学。在实验科学中,样本性质相对稳定,样本偏差本身较
小,且可以通过恰当的实验设计,比如正交实验之类,来避免样本偏差。非实
验科学则不然,研究变量在人群中常呈现不同的概率分布,而且基本上无法做
受控实验。最好的情形,不过是尽量以好的抽样方法设计,避免样本偏差。然
而很多情形下,样本偏差都是跟人们的自选择行为紧密相联,单靠抽样设计,
根本没有办法消除。这时候我们就不得不面临如何处理样本偏差的问题。
然而多少年来,处理样本偏差,并没有成型的统计方法。这常常属于象托
克维尔这样的大师发挥洞察力的领域。只是到了七十年代,情况才有了根本改
变。为此立下汗马功劳的是詹姆斯·赫克曼,二OOO年经济学诺贝尔奖得主
之一。
* * *
詹姆斯·赫克曼,一九四四年生于芝加哥,本科专业是数学,一九七一年
在普林斯顿大学拿到经济学博士学位。此人特别牛,早在一九七四年,他就以
一篇研究妇女劳动供给的论文《影子工资、市场工资与劳动供给》,奠定了他
无可争议的学术地位。在这篇文章及其后续论文中,他提出了处理样本偏差和
自选择问题的一般方法。
且让我们用一个劳动市场的例子,简单介绍一下赫克曼的贡献。我们要研
究工资w与某个决定工资的因素x(比如说教育)之间的关系。假如我们能够
观察到每个人的工资w和教育程度x,并且绘制出如下的散点图,那么工资和
教育之间的关系,就应当如下图中的实线所示。然而,在实际生活中,我们无
法观察到每一个人的工资水平。许多人,特别是已婚女子,当其工资低于某个
域值时,会选择不工作。而且这个域值还因人而异,有高有低。对于不工作的
人,我们可以了解他们的教育程度,却不知道他们在市场上,可以拿到多少钱
一小时。他们的工资是观察不到的。继续以上面这张图作比,你只观察得到实
心的样本点,空心点是不工作的人,你看不到他们的工资。假如你只拿实心样
本点来作研究的话,得出的关系就如图中虚线所示,显然这大大低估了教育对
工资的影响。
不难看出,这种样本偏差,无论我们怎么设计抽样方法,都无法消除。即
使你去问当事人,也不一定能得到你所要的资料----这些人知道,自己真去找
工作,工资十之八九会低于某个域值,还不如在家操持家务划算,却不一定知
道具体能拿多少钱。
赫克曼的最突出贡献,就是找到了一种令人满意的方法,使得我们只要根
据可以观察到的资料,就能够估计出上图中由实线代表的正确关系,避免由虚
线代表的样本偏误。他的方法,如今被称为赫克曼校正( Heckman
correction),已经成为十分标准的数据分析工具,在许多中级的
计量经济学教科书上,都有讲授。其基本思路,倒不怎么复杂。整个校正过程,
大致可以从概念上分成三个步骤。
第一步,是估计参加工作的概率与可观察变量之间的关系,比如不同教育
水平的人,参加工作的可能性各有多大。作此估计,不需要知道各人的工资多
少,只要知道不同教育水平的人,有多大比率参加工作就成了。一般来讲,教
育水平越高,工作的概率就越大。
第二步,删去不工作之人的样本,并对余留样本点作出调整。在每一个教
育水平上,不工作的概率越大,则删去样本点的数目也相对越多,由此引入的
选择误差也就越大。于是调整的方法,就是依照工作概率的不同,将各样本点
垂直往下位移。不工作的概率愈大,也即工作概率愈小,向下位移就愈大。反
之,工作概率愈大,向下位移就愈小;工作概率百分之百的,不作位移。(参
见下图,实心点下移到由空心点标示的新位置。)
第三步,利用位移后的样本点,求解工资与教育关系。理论上可以证明,
由此得出的关系线,与第一个图中标出的真实关系线,应当是一致的(参见下
图)。
在实际的数据分析中,第一步求得工作概率之后,第二步计算各样本点位
移大小,和第三步计算回归线,是合并在一起,同时联立计算的。所以实际的
计算程序,只有两步。
这个介绍自然十分简略。赫克曼校正法的详细工作原理,牵扯到许多概率
统计方面的预备知识,就不是三言两语可以讲清的了。有兴趣者,不妨自己去
查阅教科书。
(注:本文若干段落,来自网友老王的建议,谨致谢意)
作者:
Anonymous
在
罕见奇谈
发贴, 来自 http://www.hjclub.org
返回顶端
显示文章:
所有文章
1天
7天
2周
1个月
3个月
6个月
1年
时间顺序
时间逆序
海纳百川首页
->
罕见奇谈
所有的时间均为 北京时间
论坛转跳:
您
不能
在本论坛发表新主题
您
不能
在本论坛回复主题
您
不能
在本论坛编辑自己的文章
您
不能
在本论坛删除自己的文章
您
不能
在本论坛发表投票
您
不能
在这个论坛添加附件
您
不能
在这个论坛下载文件
based on phpbb, All rights reserved.
[ Page generation time: 0.546159 seconds ] :: [ 22 queries excuted ] :: [ GZIP compression enabled ]