历史统计学,是用统计学的法则,拿数目字来整理史料,推论史迹,这个名称是我和我的几位朋友们杜撰的。严格的说,应该名为“史学上之统计的研究法”,因贪省便,姑用今名。但我们确信他是研究历史一种好方法,而且在中国史学界,尤为相宜。我们正在那里陆续试验,成绩很是不坏,所以我愿意把我们所拟的方法介绍诸君,盼望多得些同志共同做去。
我们为什么想用这种方法,研究历史呢?我们以为欲知历史真相,决不能单看台面上几个大人物,几桩大事件,便算完结,最要的是看出全个社会的活动变化。全个社会的活动变化,要集积起来比较一番,才能看见。往往有很小的事,平常人绝不注意的,一旦把他同类的全搜集起来,分别部类一研究,便可以发见出极新奇的现象,而且发明出极有价值的原则。比方我们看见一两只蝴蝶算得什么呢?一旦到动物学者的手里,成千成万的蝴蝶标本,聚拢起来,综合一番,分析一番,便成绝大学问。我们做史学的人,对于史料之搜集整理,也是如此。
统计学的作用,是要“观其大较”。换句话说,是专要看各种事物的平均状况,拉匀了算总帐。近来这种技术应用到各方面,种种统计表出来。我们想研究那件事,只要拿他的专门统计表一看,真相立刻了然。所以“统计年鉴”等类之出版物,真算得绝好的现代社会史。假如古代也有这种东西传下来,我们便根据着他,看出许多历史上“大较”的真相。然后究其所以然之故,岂非快事!这种现成的饭,固然没得给我们,但我们用自己的努力,也许有许多方面能弥补这种缺憾来!
用统计方法治史,也许是中国人最初发明。《史记》的“表”,是模仿那“旁行斜上”的《周谱》。《周谱》这部书,今虽失传,想也该是西纪前三四百年人做的。后来历代正史多有表,给我们留下种种好资料和好方法,可惜范围还太窄了!许多我们想知道“大较”的事件,都没有用表的形式排列出来。到清初有位顾栋高先生著成一部五十卷的《春秋大事表》,把全部《左传》拆碎了,从各方面分析研究,很有统计学的精神!我从小读这部书,实在爱他不过,常常想我几时能有工夫,定要把全部《二十四史》,照他样子,按着我自己所要研究的目的,分类做一部通表,才算快事哩!我这个心愿怀抱了二十多年,但我很惭愧到今日还没有动手!
我想我们中国的史学家做这件事,便宜极了。因为我们纸片上的史料,是丰富不过的。一切别史,杂史,文集,笔记之类,且不必说。就以一部《二十四史》而论,真算得文献宝藏!就学校里头学历史的学生看,固然恨他“浩如烟海!”就我们专门做史学的人看,真不能不感谢我们先辈给我们留下这大份遗产!我们只要肯在里头爬梳,什么宝贝都可以发见出来。
以上把这种学问的理论大略说明了。以下要说我们着手的试验及其成绩。
我多年想做一张表,将《二十四史》里头的人物分类,学者,文学家,政治家,军人,大盗,……等等,每人看他本传第一句“某某地方人也”,因此研究某个时代多产某种人,某个地方多产某种人。我这计划曾经好几次和我的朋友丁文江先生谈起。他很赞成,后来他说先且不必分类,只要把正史上有传的人的籍贯列下来,再说。他自己便干起来了,现在还没有完全成功。只是把几个统一的朝代——汉,唐,宋,明做成了。编出一张很有趣的“历史之人物地理分配表”。
他那张表的体例,是将《汉书》《后汉书》《新唐书》《宋史》《明史》中有传的人都列出,调查他们的籍贯,分配现今各省,再拿所有列传总数,按照各省人数,列出百分比例。例如两汉通共六百六十五篇传:河南人二百零九,占百分之三十一零四三。山东人一百十八,占百分之十七零七五。湖南人只有两个,占百分之三厘。福建人只有一个,占百分之一厘五。广东云南贵州一个也没有。全表以是为推。我们在这表中可以看出几个原则:
(一)帝都所在地,人物往往特多。例如后汉之河南,占百分之三十七而强。唐之陕西,占百分之二十一而强。北宋之河南,占百分之二十三而强。南宋之浙江,占百分之二十二而强。都是居全比例之第一位。但其中有两个例外:前汉的陕西,仅占百分之十,居第四位,不惟远在山东河南之下,而且还在江苏之下。明的直隶,仅占百分之七,居第五位。
(二)南北升降之迹甚显著。如山东,陕西,直隶,山西,汉唐时平均比例,皆在百分之十以上,多者至二三十以上。宋明后,皆落至十分以下,平均不过五六分。内中惟河南勉强保持平度,然亦有落下的趋势。反之如江苏,安徽,江西,浙江,汉唐时甚微微,以次渐升,至明时皆涨百分十以上。此种现象,恐由于宋南渡后,南方之人为的开发,与蒙古侵入后,北方之意外的蹂躏。但人民自身猛进与退萎之精神,亦不容轻轻看过。
(三)原则上升降皆以渐,然亦有突进者,例如四川在前汉不及百分之二,后汉忽升至百分之六,其后即上下于此圈内。浙江向来不过百分之二三之间,北宋忽升至百分之八,南宋又升至百分之二十二。江西向来不到百分之一,北宋忽升至百分之五以上,南宋忽升至百分之十三以上。福建情形与江西亦大略相等。我们想这种情形,系由文化之新开辟。从前这些地方,离中央文化圈很远,一经接触之后,再加以若干年之酝酿醇化,便产出一种新化学作用。美国近年之勃兴,就是这种道理。以此推之,还有许多新地方,也该如此。这表现仅编到明朝为止。若继续编下去,当又有新资料可以证明这个公例:例如湖南始终没有到过百分之二,倘将清史编出来,恐怕要骤涨到百分之十以上。广东向来差不多都是零度,倘将民国十年史编出来,恐怕也要涨百分之十以上。
(四)此外尤有一最显著之现象,则人物分配,日趋平均。前汉山东占百分之三十而弱,河南占百分之二十而弱。后汉河南占百分之三十七而强,山东占百分之十二而强。仅此两省,占汉史人物之半数。其余长江流域各省,没有能到百分之五的。湖南,福建,两广,云贵,都是零度。唐宋人各省都渐渐有人,均匀许多了。到明时越发均遍,没有一省没有人,除广西,云,贵三省不满一分外,其余各省最高的不过百分之十三四,最低的省分亦有百分之一二,十八省中之九省,皆来往于百分之三与百分之七。平均数目之间,可见我们文化普及的程度,一天比一天进步。倘若将清史续编下去,只怕各省不平等的现象,还要格外减少哩。
诸君想想象这样粗枝大叶的一张表,我们已经可以从这里头发现四个原则来,而且还能逐个求出他所以然之故,这是何等有趣的事!凡做学问,终要在客观正确的事实上,才下判断,这是人人共知的。史学对象的事实,你说单靠几位大英雄的战记,几位大学者的著述吗?这固然可以表现社会的特殊力,却不能表示社会的一般力。我们搜集史料,断不能以此为满足。许多事实,并不必从个人有意的动作看出来,即如这张表所根据的材料,不过每篇的一句——“某处人也”,这样干燥无味的句子,从前读史的人,谁又肯信这里头还有研究价值?殊不知拆开了一句一句,诚丝毫无意味,聚拢起来,一综合,一分析,无限意味都发生出来了。这表所编仅限于两汉唐宋明五代,而且是不管人物如何,有一篇传算一篇,倘若把《二十四史》全数编出,再将人物分类,恐怕继续发明的原则,还要多哩。青年诸君啊!须知学问的殖民地丰富得很!到处可以容你做哥仑布!只看你有无志气,有无耐性罢了。
我又请说我们别方面的试验。我近来因为研究佛教史,有一回发生起趣味;要调查我们先辈留学印度的事实。我费不少的劳力,考据出二百来个人,内中有姓名可考者一百零五,无姓名可考者八十二。我做了一篇文叫做《千五百年前之留学生》,曾经登在《改造杂志》。我在那篇文章里面,做了种种统计:
(一)年代别
西历第三纪后半二人
第四纪五人
第五纪六十一人
第六纪十四人
第七纪五十六人
第八纪前半三十一人
(二)籍贯别(内籍贯可考者仅六十五人)
甘肃十八河南八人山西七人两广七人
四川四人湖北五人直隶四人陕西四人
山东四人新疆四人辽东四人湖南三人
(三)行迹别
1.已到印度学成后安返中国者四十二人
2.已到西域而曾否到印度无可考者十六人
3.未到印度而中途折回者十四人(?)
4.已到印度随即折回者二人
5.未到印度而死于道路者三十一人
6.留学期中病死者六人
7.学成归国死于道路者五人
8.归国后第二次再留学者六人
9.留而不归者七人
10.归留生死无考者八十人(?)
(四)留学期间别(别考者)
四十年以上一人
三十年以上一人
二十年以上一人
十五年以上八人
十年以上五人
五年以上三十九人
(五)经途别(可考者但有往返异途者)
海道六十八人
西域葱岭路七十七人
于阗罽宾路二人
西藏尼波罗路七人
云南缅甸路二十许人
我根据这些数目字,知道事实上“如此如此”,我便逐件推寻他“为什么如此如此”,于是得了许多条假说,或定说。对于那位事情的真相,大概都明了了。我高兴到了不得,好像学期试验,得了一回最优等!诸君若要知道详细,请把那篇文章一看。
我研究佛教史,从各方面应用这种统计法,觉得成绩很不坏!我也曾从各家金石目录中,把几千种关于佛教的石刻,如造像经幢之类,调查出土的地方,调查所刻文字的内容,如所造像为释迦像,为弥勒像,为阿弥陀佛像,所刻经为《心经》,为《金刚经》,为《陀罗尼经咒》等等。我因此对于各时代各地方信仰态度之变迁,得着一部分很明了的印象。我又曾将《正续高僧传》及各家经录中凡关于佛教著述的目录,搜寻出一千来种,用他们所解释的经论分类一看下去,便可以知道某时代某宗派兴衰状况何如。这些都是我现时正在进行的工作。我做这种麻烦的工作,很劳苦!但是我很快乐!因为我常常在我的工作中发见意外的光明。我确信我的工作,做一分定有一分成绩,做十分定有十分成绩。
我想这种方法,可以应用到史学的全部分。我的脑筋欢喜乱动,一会发生一个问题,我对于我所发的问题,都有兴味!只可惜我不能把每日二十四点钟扩充为四十八点钟!所以不能逐件逐件去过我的瘾!现在请把思做而未能做的题目,随便说几个请教诸君。
(一)我们试做一篇“历代战乱统计表”。把战乱所起的年月,所经过的年月,所起的地方,所波及的地方,为何事起,起于某种性质的人,为敌国相攻,抑人民造反;为自相残杀,抑对外防卫。……诸如此类,预定十几个题目,依格填去,也不必泛滥许多书籍,只要把《正续资治通鉴》编完,我信得过可以成一张很好的表。根据这表研究他“为甚么如此”,一定可以发明许多道理来。
(二)我们试做一篇“异族同化人物表”。先把各史有传的人姓氏谱系来历,稍为蹊跷的,一一如长孙宇文之类,都去研究一下。考定某姓出于某族,并不是很困难的事。一面将各史传中明记某人本属某族,一一如金日本籍匈奴,王思礼本籍高丽类,一一列出。某族别则分为匈奴鲜卑氐羌蛮韶高丽女真蒙古满洲等等,看某种族人数何如,某时代人数何如,某地人数何如。此表若成,则于各外族同化程度及我们现在的中华民族所含成分如何,大概可以了解。
(三)我们试做一篇“地方统治离合表”。其各地在本族主权者统治之下不计。其北魏元清三代虽属外族,而势力统一全国或半国者亦不计。自余各地约以现制各道为区域。每一区域,先记其未隶中国版图之年代,既隶之后,或本地异族据而自立,或外来异族侵据,皆记之,也不必记详细事迹,但记分立侵据之年代及年数。有恁么一张表,我们各地方进化退化之迹,自然有许多发明。
(四)我们试做一篇“历代著述统计表”。把各史的艺文志,和各人的本传,凡有著述者,将其书名部数,卷数,列出,再将书的性质分类,将著书人的年代籍贯分类,求出某时代某地方人,关于某类学问的著述有几多部,几多卷,只把数目字列出,便可知道某时代某种学问发达或衰落,某地方文化程度或高或底,或进化,或退化。
(五)我们试做一篇“历代水旱统计表”。我们历代史官,对于这类灾异,极为注意。试把各史的本纪和五行志做底本,参以各省府县志,以年代地方为别,做一张表,看隔多少年发一回,何时代多,何时代少,这样一来,上而气候,地质的变化,下而政治的修明或颓废,都可以推测得几分。诸君试思天下最无用的东西,还有过于五行志么!到了我们这些刁钻古怪的史学家手里头,也许有废物利用的日子哩。
像这种大大小小的统计题目,常常在我脑子里头转的,不下几十个,我也无暇细述。姑且举这五个不伦不类的讲讲。诸君举一反三,或者想出来的题目,比我还多还好哩!总之凡做学问,不外两层工夫:第一层要知道“如此如此”。第二层要推求“为甚么如此如此”。论智识之增殖,自然以第二层为最可宝贵。但是若把第一层看轻了,怕有很大的危险!倘若他并不是如此,你模模糊糊认定他如此,便瞎猜他为什么如此,这工夫不是枉用的么。枉用还不要紧,最糟是瞎猜的结论,自误误人。所以我们总要先设法知道他“的确如此如此”,知道了过后,我自己能跟着推求他“为什么如此”,固然最好,即不能,把事实拢出来,让别人推求也是有益的事。问设什么法子才能知道“的确如此如此”呢?我简单回答一句:“有路便钻。”统计法,便是里头一条路。
我并非说这是研究史学的唯一好方法,但我敢说最少亦是好方法中之一种。因为史家最大任务,是要研究人类社会的“共相”和“共业”。而这种“观其大较”的工作,实为“求共”之绝妙法门。所以我们很欢喜他,加以我们现存的史料实在丰富,越发奖励我们工作的兴味。但是这种工作,是很麻烦很劳苦的!而且往往失败!我自己就曾经失败过好几回!
我并不劝各位同学向这条路上走,但那一位对于这种工作有兴味,不妨找一两个题目一试,须知从麻烦劳苦中得一点成功,便是人生最快乐的事!或者还可以说人生目的就在此地!