7月26日清晨,北京大学燕园校区,一位老人坐在二教走廊角落的座椅上。他面色红润,戴一副眼镜,身穿浅色棉麻衬衫,体态微胖,不时用毛巾擦汗。虽是暑假,不断有学生走过,他边喝咖啡,边观察这些来往的学生。学生们则很少留意到他。

他是美籍华裔历史学家李中清,现在是香港科技大学人文与社会科学学院院长。每年夏天,他都会来北大教书,今年的课题是“从量化数据库理解1700-2000年的中国”,其中一部分研究就是以北大学生为对象进行的。

李中清和研究团队把64500名北大学生的学籍资料录入电脑,从中发现了北大招生的秘密——那些每年9月能拿着录取通知书报到的新生,能考上北大,除了成绩,还存在其他复杂的因素。

用六万份北大档案解密,考上中国顶级名校的都是什么人?-激流网8月3日,北京,暑期北京大学游客爆满,团体游客与散客均在北京大学东门口排队,散客队伍长达百米。(@视觉中国图)

饭局上的“诱惑”

李中清今年64岁,从最早专业学习古代史算起,到现在,已经40多年。他对历史的研究方法不仅涉及到史料运用,而且会使用大量数据分析。

李中清是华人诺尔贝物理学奖得主李政道的儿子,幼年时,李政道希望他能走上理工之路,经常辅导他学数学,但李中清说,“只要他坐在我身边,我的大脑就会一片空白,后来他只能放弃。”

李中清大学之所以选择历史,也是为了不想太依赖数学,不想受父亲影响太大。上世纪70年代,李政道给他写过一组数学公式,当时他只是背了下来,并没有真正理解。现在他还保留着这组公式,而且,等到他开始用数据分析的方法研究历史,也把这组公式反复运用到工作之中。

最终回到父亲的“影响范围”内,多少有点偶然。1983年,李中清到北京,在第一历史档案馆参加一个学术会议,偶然听说辽宁省档案馆有一大批历史资料在申请销毁。当时他立即请第一档案馆的朋友帮忙联系,又去辽宁省档案馆查阅这批档案。最终,他带了5大本乾隆时期的人口登记资料回美国。

李中清只是觉得这些内容很有价值,并没有想好怎么研究。即便在美国学界,对这种系统的人口史料研究,都缺乏经验。他后来听说南加州有位学者分析过类似的日本人口史料,就跑去请教。在对方帮助下,他利用IBM电脑建立起数据库,开始用量化分析方法进行研究。之后,他开始大量收集中国东北各地的历史人口史料。这个过程花了他20多年时间,最终建立起基于八旗户口册的中国多代人口数据库系列,包括辽宁、双城和皇族三个子数据库。

1998年北大百年校庆,当时李中清在北大担任客座教授。有一次,时任北大副校长迟惠生请他吃饭,聊起李中清的研究,迟惠生说,北大也有非常齐全的“人口数据”:学籍卡。这又把李中清的好奇心勾起来了,他很感兴趣,提议把这些数据录入电脑,他们来分析看有什么结果。

当时国内还没有高校向学者公开过学籍卡资料,更别说对外国学者。根据李中清的经验,外国学界很强调公开,国内这方面,特别是档案馆,对保存的材料态度很不一样,“他们可能觉得最重要的是保护,不是应用”。没想到,当时主管北大档案工作的何芳川副校长对此也积极赞同。

“97、98年,国内的气氛有点不一样,”李中清向本刊回忆,“香港回归,北京提出申办2008年奥运会。我觉得国内的人比较乐观、自信。当时校长也很有趣,他很支持,也没有问我研究这些东西干吗。”