供经济学家使用的调查数据库

不同于可以通过科学实验直接获取数据的自然科学,社会科学的数据大多只能通过观测得来。由于搜集、整理大样本数据需要耗费不菲的时间、金钱和精力,大多数社会科学研究者无从以一己之力获取较为全面的数据。在这一背景下,调查数据库为研究者开展经验研究帮上了大忙。

对于经济学者而言,如下五个调查数据库是最有可能用到的,这篇日志权当是一篇笔记,将这五个数据库的基本信息罗列如下:

1、中国城镇家庭收入调查Chinese Household Income Project,CHIPs

该数据库的主要作者是中国社会科学院赵人伟研究员与北京师范大学李实教授。

1988年,中国社会科学院经济研究所收入分配研究课题组成立,开始研究中国改革开放以来居民收入差距问题。基于这一研究目的,该课题组当年即通过入户问卷调查的方式创建了CHIPs数据库(1988年),并于1995年、2002年和2007年对数据库予以三次更新。该数据库得到众多学者的欢迎,并被广泛引用。

2、中国健康与营养调查China Health and Nutrition Survey,CHNS

该数据库创建于1989年,是由美国北卡罗来纳大学人口中心与中国预防科学医学院联合进行的大规模的社会健康调查。调查的内容涉及诸多方面,包括健康学、营养学、社会学、人口学、经济学、公共政策等多个学科。(本段引自网络)

3、中国健康与养老追踪调查China Health and Retirement Longitudinal Survey,CHARLS

这是一项由北京大学国家发展研究院中国经济研究中心主持的项目,在我国每两年追踪一次,目的是收集能够代表年龄在45岁以上(包括45岁)的中国居民的数据,样本规模大约为10,000户,17,000个人。2008年秋季在我国两省进行了预调查,计划2011年在全国多个省份开展调查。(本段为官方网站介绍)

4、中国家庭动态跟踪调查Chinese Family Panel Studies, CFPS

该数据库是北京大学中国社会科学调查中心(ISSS)实施的一项旨在通过跟踪搜集个体、家庭、社区三个层次的数据,反映中国社会、经济、人口、教育和健康的变迁,为学术研究和政策决策提供数据为目标的重大社会科学项目。(本段为官方网站介绍)

5、中国综合社会调查Chinese General Social Survey,CGSS

该数据库是中国第一个全国性、综合性、连续性的大型社会调查项目。从2003年开始每年一次,对全国125个县(区),500个街道(乡、镇),1000个居(村)委会、10000户家庭中的个人进行调查。通过定期、系统地收集中国人与中国社会各个方面的数据,总结社会变迁的长期趋势,探讨具有重大理论和现实意义的社会议题,推动国内社会科学研究的开放性与共享性,为国际比较研究提供数据资料。至2008年止,CGSS一共进行了五次年度调查,完成了项目的第一期。自2010年起,CGSS开始了项目的第二期,计划从2010年开始到2019年为止,每两年进行一次调查,共进行五次调查。(本段引自网络)

 

怎样的阅读是重要的?

前天是一年一度的世界读书日,从前天开始就想在博客上写点什么,但一直没有找到突破口,直到今天读到这样一则微博:

@李飞在别处:某些人对积累知识的过分强调远比独立思考要多。天天跟别人说:读xxx书去,掌握xxx文献去,不读书没法给你解释沟通。我以前受这个毒害太深,但四年中,让我越发觉得1)很多牛人决没我读得多,但人家成就我赶不上。2)读书和创新性思考的关系未必总是正相关,有时有挤出效应。

诚哉斯言。

阅读是一项被赋予了太多形而上意义的活动,这些意义又反过来湮没了阅读的现实功用,阻碍了对阅读技巧的深入探寻。

我以前曾经模糊地认识到“读书如读人”。现在看来,这句话或许可以反过来说,与人打交道,和与书打交道是同一个道理。在与他人沟通时,自己要首先知道沟通的目的是什么,自己的诉求是什么,若是漫无目的不知所云,于人于己都无益。同样地,在读一本书之前,总得知道为什么要读这本书,是权当消遣,是应对考试,还是需要仔细研读。若是漫无目的的翻阅,不仅耽搁自己的时间,还浪费书的表情。

面对学术著作所要做的,与其说是阅读,不如说是搜寻(search),在各式“洋八股”的文字背面找到作者的真实意图,并与作者展开对话。国外的许多知名期刊都列有review专栏,用来刊出一些学者对另一些学者新著的评价。从某种程度上说,这些review比作者的论文更见功力。

于我而言,以搜寻、汲取和体验为主线的阅读,方才是最重要的。其他形式的阅读,越少越好。

 

阅读是个技术活

一、怎样最有效地阅读一本书

前几天发现了一本名为《如何阅读一本书》(How to Read a Book)的书,颇觉有趣。劝人阅读者众,但教人阅读者寡——到底应该怎样阅读一本书,才是最有效的?

很长一段时间以来,或许是自身的完美主义倾向使然,我在阅读学术文献之前常常莫名地设想:如果不花大块时间,是不可能读完它的。我甚至开始翻译自己将要阅读的每一篇论文,甚至是一本书——例如写论文必须阅读的The Limits to Capital,结果自然是效率颇低,事半功倍。

尽管已有所认识,但我一直没有找到替代性的方法。直到最近修改论文,我才发现,这种行之不同的阅读方法,与论文写作中的毛病是贯通的——太过刻意地修饰论文的每个字句、想写的东西太多,反而湮没了所叙问题的主线。正是因为我如是看待自己的论文,我在阅读其他人的论文时也是抱定同样的心态——耽于细节,却忽略了主线逻辑

关于主线逻辑,清华教授施一公在《学生如何提高专业英文阅读能力》有一段颇为精当的论述,摘于此以自省:

在读具体的科研论文时,最重要的是了解文章的主线逻辑。文章中的所有Figures都是按照这个主线逻辑展开描述的。所以,我一般先读introduction部分,然后很快地看一遍Figures。大概知道这条主线之后,才一字一句地去读results和discussion。

那么,我该如何把握这个主线逻辑呢?当务之急,是要学会并善用曾被我长期忽略的三个工具:Key words,JEL Classification和Index,它们仅由零散的单词、词组所组成,因而能够快速揭示一篇学术文献的主线逻辑。前两者多为论文所用,而Index在每本学术著作结尾部分都可找到,有些更为专业的著作还额外列出Author Index。

二、读多少书最有效?

施一公在另一篇博文《如何做一名优秀的博士生:(二)方法论的转变》里说了这样一段话:

在我的博士生阶段,我的导师Jeremy Berg非常重视相关科研文献的阅读,有每周一次的组内journal club,讨论重要的科研进展。刚到Nikola实验室,我曾试图表现一下自己读paper的功底、也想同时与Nikola讨论以得到他的真传。96年春季的一天,我精读了一篇《Nature》article,午饭前遇到Nikola,向他描述这篇文章的精妙,同时期待着他的评述。Nikola面色有点尴尬地对我说:对不起,我还没看过这篇文章。噢,也许这篇文章太新,他还没有来得及读。过了几天,我因故阅读了一篇几个月前发表的《Science》research article,又去找Nikola讨论,没想到他又说没看过。几次碰壁之后,我不解地问Nikola:You know so much. You must read a lot of papers. Why is it that you didn’t read the ones I read?(你知识如此渊博,一定是广泛阅读了大量文献。你为什么恰好没有读我提到的这几篇论文呢?) Nikola看着我说: I don’t read a lot. (我阅读不广泛。)我反问: If you don’t read a lot, how can you be so good at research? And how can you reference so many papers in your own publications?(如果你不广泛阅读,你的科研怎么会这么好?你怎么能在自己的论文里引用这么多文献?)  Nikola的回答让我彻底意外:(大意)I only read papers that are directly relevant to my research interests, and I only read more papers when it comes to writing my own papers(我只读与我的研究兴趣有直接关系的论文。并且只有在我写论文时才会大量阅读。)

有感于导师的这段话,施一公说:

在博士生阶段,尤其是前两年,我认为必须花足够的时间去听各相关领域的学术讲座、并进行科研文献的广泛阅读,打好critical thinking的基础;但随着科研课题的深入,对于文献阅读和学术讲座就需要有一定的针对性,也要开始权衡时间的分配了。
 
这段话简直就是说给对习惯于四处搜罗文献、“饥不择食”的我听的。一直以来,我总认为读书应该多多益善,对钱钟书“横扫清华图书馆”之类的例子印象颇深,尤其是在去年,我总是漫无目的地在各座图书馆之间东奔西跑,颇似一只掰玉米的猴子,只是多知道了一些书名,对自己的写作却并无多少帮助。
 
对于我来说,问题不再是需要读多少书,而在于:面对给定的任务,我读多少书最有效?在这个过程中,能少读就少读,把握主干文献就足够了,至于一丛丛旁枝,就随它去吧。说到这,又回到如何把握“主线逻辑”上的第一个问题上了。
 
技术这个词,并不仅与我头脑中的“理工科”相干。在生活中,智慧也是不可或缺的,而技术则可以作为智慧的支撑。阅读,就是这样一个不折不扣的技术活。

如何寻找暗时间

最近看了刘未鹏博客集结而成的一本名为《暗时间》的书,其第一部分“暗时间”给我的印象最深。且不谈书本身,这位1984年出生,却已经写了六七年博客的程序员,其实就已经很好地将自己的生命延展到“暗时间”的范围之内了。

在这本书里,刘未鹏是这样阐释“暗时间”的:

认为时间对每个人是均等的是一个错觉,认为别人有一天,我也有一天,其实根本不是这样。如果你正在学习一门专业,你使用自己所投入的天数来衡量,很容易会产生一种错觉,认为投入了不少时间,然而其实,“投入时间”这个说法本身就是荒唐的,实际投入的是时间和效率的乘积。你可以“投入”很多时间在一件事情上面,却发现毫无进展,因为你没有整天把你要做的事情,要学习的东西常驻在你的大脑中,时刻给予它最高的优先级。

能够充分利用暗时间的人将无形中多出一大块生命,你也许会发现这样的人似乎玩得不比你少,看得不比你多,但不知怎么的就是比你走得更远。

他说得很有道理,工作量是不能用时间,尤其不能用“几个月”、“几天”来衡量,因为每个人在这“几个月”、“几天”里的表现可能完全不同。哪怕没有大块的时间,只要专注进去了,即使见缝插针也可以干不少活。我在几年前就发现自己“外松内紧”了,说白了,其实就是不够专注,总是以投入的整块时间聊以自娱,其结果自然可想而知。

我把刘未鹏的这些建议概括为三个词组:

1、Think by Myself

独立思考,这一点至为重要。

首先知道我是谁,我需要自己成为一个什么样的人,在这个过程中,不要将别人希望自己所扮演的角色误认为自己的真实模样。

而后再来通过完成一些任务,以成为这样的人。我现在其实是一个“见习学者”,说白了就是“学徒”。作为“见习”的“学徒”,我需要服从一些外部施加的规则,应当按照既定格式及要求,发表学术论文,完成学位论文;作为“学者”,我当有独到见解,在思考环节不应受制于他人,“学者”倘若失去独立性,后果则不堪设想。

2、Learning by Doing

干中学。刘未鹏列举了他父亲作为例子:他父亲通过自学,学会了修理几乎所有的家用电器,并开始解答高中数学题。刘未鹏也是通过自学,开始系统接触各种计算机技术及认知科学。这对我来说非常重要,我不一定要寻求听课来弥补自己的知识缺漏,“教是最好的学”,今天下午代班时,我在二十几个听众面前梳理了凯恩斯的三大心理规律,而其中的线索正是我上午备课时梳理出来的,这种感觉很不错。

3、Step by Step

一步步来。这是我以前总是做不到的,从小开始,我总是希望自己写下的每一张纸上没有任何涂改,如果有涂改的话,我往往会将它们撕掉,从而白白浪费了时间。事实上,没有什么可以一步登天。这次写论文也是犯了不肯一步步来的错误,空有雄心壮志却不肯踏上实现的路径。

这三个含by的词组,值得铭记于心。

另一件令人高兴的事情是,我找回了人大经济论坛的账号,这个账号是2004年注册的,颇有些年头了。

生下来,活下去

作为一种用于分析国民经济各部门关联的经济分析法,投入-产出分析的基本思路在许多人的人生决策中扮演着不可或缺的作用。人们对做某件事的投入水平与可能产出的水平予以比较,而后做出自己的决策——“我要不要考研”、“我要不要谈恋爱”、“我要不要修双学位”等大大小小的问句,在各个大学的BBS上亦是随处可见。

投入-产出分析方法背后的潜在含义是:投入了就应当获得产出,否则就没有投入的必要。问题在于,没有人知道投入到底能带来多少产出,各种随机事件都有可能影响产出的水平。如果到了最后,还是没有产出,又当如何?

最近几天,北京大学博士、哈佛大学博士后、人民大学化学系主任“不幸辞世”的消息在媒体上、在校园中不断被传播开来。如果可以将在校学生的自寻短见归为学业不顺、感情不顺,那么,这位即将迎来不惑之年、事业正处黄金期的青年才俊,又为何要狠心地与亲人和学生诀别呢?

没有人知道答案,每个人只能暗自嗟叹和揣测,不过,有一点可以明了,这位教授曾经辉煌的履历和眼下苍凉的终局,震撼了许多人的内心,因为他所获得的一切,正是不少人所孜孜以求的,也是社会主流价值观所鼓励和肯定的。这位教授以他的生命为代价,为公众画了一个大大的问号:追求良好的教育背景、体面的职业职位、公众的艳羡目光,到底是为了什么?为什么在得到了这一切之后,幸福和快乐还是与人生无缘?

我想,或许一切的根结,就在于投入-产出的思维方式上。在以产出水平傲人的优秀群体中,这种思维方式可能更加根深蒂固。他们或许从儿时起,就开始领受来自外界的赞扬声音,这一方面让他们颇有成就感,另一方面却给他们灌输了一个观念:如果没有良好的表现,就不会有幸福感。换言之,幸福不是无条件的,是需要自己竭力拼杀才能感受到的。

在这种思维方式下,投入带来产出,产出带来外界肯定,外界肯定带来幸福感,幸福不再是一种人皆可有的权利。只有不断地投入,才是幸福感源源而来的重要保证。写到这里,我不由得想起了一篇在网络上广为传播的文章《谁也不曾辜负自己的青春》里的一段话:

“我咬紧牙关,一路奔腾:重点大学,考研,北漂……多年来马不停蹄,奋力厮杀,终于成为一家知名外企的白领。身着优雅的宝姿,意气风发地坐在明亮的写字间里,成就感在周身荡漾。可我仍在不断拼搏,不断为自己充电,每样工作都力求做到无懈可击。我的青春,如开弓的箭,一程一程呼啸着前进。目标,永远在前方的前方。”

对于众人眼中的成功人士来说,这是一种再熟悉不过的生活状态,他们可以将之称作“奋斗史”,不过,成功人士毕竟没有那么多,“一将功成万骨枯”,在他们背后,坚守着同样逻辑的人,则不得不面对令人尴尬的结局——辛苦的付出,没有换来一点点回报,投入-产出-外界的肯定-幸福感的“良性”循环被打破了,前方似乎是一个望不见尽头的黑洞。在这个关卡上,有人咬咬牙,挺了过去,有些人却在失去了重心的生活中,被“黑洞”遮住了双眼,人生就此戛然而止。

这种循环,牵动着幸福和沮丧的情绪,让人不由自主地喜与悲。从这种循环中走出来,却又是一件并不容易的事。或许,只有将如下两点铭刻于心,才有可能走进另外一重天地之中:

第一,幸福是无条件的,来到这个世界上的每一个人,都有幸福的权利。无论这个人贫穷还是富有、英俊还是丑陋、高大还是矮小、聪明还是愚蠢,自这个人降临人世起,都踏上了命运为之铺就的一条红毯,通向同一个终点。从这个意义上说,无需诉诸外界以探求存在的意义。存在的本身,就是存在的意义。

第二,做自己喜欢做的事情,找到丈量自己时间的标尺。《资本论》里有一个极好的句子:“劳动产品剩下来的东西……只是无差别的人类劳动的单纯凝结。”时光不会与人撞个满怀,如若不把时光凝结于清晰可见的事物,它只会与人擦肩而过。在生活中奋斗的最大意义,也正体现于此:不断的投入、不断地奋斗,并非理直气壮索取产出的理由,而是一种丈量时间、书就独特生命的方式。相比而言,有没有产出,反倒不是最重要的了。

这两点听起来那么难以实现,归结起来,却只有简单的六个字:生下来,活下去。

不论是拼杀在职场,还是安居于故里,都是生活的一个可能的选项。从这个意义上说,生活中有没有奋斗倒不打紧,要紧的是,究竟是在生活中奋斗,还是以奋斗为生活?

在《谁也不曾辜负自己的青春》中,当矢志不渝的“我”开始反思过往的生活时,坚守田园的同龄人“郑曼曼”所说的一段话,可以看做是对这个问题的回答:

我也羡慕过你,可我先生说,谁都不必失落,适合自己的人生就是最好的人生。每颗星星都各有各的方向,各有各的光彩。就像我们两个,谁也不曾辜负自己的青春。