相关系数平方"R-squared"这一列 告诉我们变量(举人数)的变化有多大比例是决定于自变量--包括行政区划级别、人口、盗 匪数、人均可耕土地面积等等的变化的,在逐步多元回归中,最能解释举人数的自变量首先 进入方程。 接下来根据第一自变量计算出第二自变量,即在第一自变量条件相同的情况下, 哪一个是最影响变量的;在第一、第二自变量条件相同时,又有哪一个最影响变量?以此类 推,罗列出相关系数平方的序列,即表5。 在关于举人人数变化这一统计中,我们清楚地看 到,一个州或县的举人数与行政区划级别关系最大。 影响举人数字多少的因素一半在于行政 区划级别。 省会和府治产生了大量与人口数不相称的举人,这非常自然,因为名门望族一般 都居住在这些行政中心 我们可以很容易地给各县确定一个排列顺序,这些县以最高 行政机构为基础,但是回归方程需要的是数值。 为了最好地反映士绅力量被行政区划预示的 程度,每一个标准都有一个假数值,反映出整个清代属于该标准的县的举人平均数。 〖ZW) 〗。 接下来,如果我们稳住行政区级,把人口量引入方程,这时影响其人数变化的因素60% 在于人口,理由明显,因为人口较多的县一般都产生较多的中举者。 在回归的第三列,开始出现有趣的结果。 在这里,我们要问:如果我们稳住行政区级及人口 不变,那么什么是最能影响举人数的变量? 36 表5最后一列"部分相关"数字显示出自第三列后 剩余的各项自变量之间的关系。 影响举人人数变化最大的是盗匪的多少,这一统计来自刑部 档案的记录。 这证明,在我们平均行政区划及人口的举人人数后,盗匪数字的多少比其他自 变量都更能影响士绅人数的变化。 基本说来,盗匪猖獗的地方,士绅就稀少--这种负相关 在度量系数、标准系数和简单相关中已得到说明。 有几个因素也许能解释这种相互关系。 士 绅最可能集中在社会和生态都稳定的地区。 而在官府难以控制的边界及易受灾害的平原地区 ,盗匪活动则猖獗。 简言之,稳定地区出士绅,不稳定地区出盗匪。 但是,在晚明一段时期 以及18世纪中叶以后,鲁西南士绅数量大幅度下降,与此同时,该地区盗匪活动增加。 这说 明,两者不仅以一种反比关系与一定的生态环境有关,它们也彼此有关。 他们之间不确定的 关系可能向两方面发展。 士绅势力大,盗匪活动就少。 而盗匪活动频繁则会导致某些士绅迁 移,同时也会导致另一些地方人士热衷于本地自卫,而不是科举及第。 下一个自变量是商业税,这是当前最常用的说明每个县商业化水平的方法,但这显然不够充 分 应当指出,各县的全部资料包括60多个变量。 对于每一个有意义的变量我都进行 了若干回归和相关分析。 这里所介绍的多元回归代表了最有意义的计算结果。 为测量商业化 程度,用每个县的市场数目、市场数与人数及市场与土地面积比例进行回归分析。 以上每一 种变量与商业化程度的相关性都不如商业税与商业化程度的相关性高。 而如果用20世纪农民 人口百分数(基本上是非商业化指数)做变量进行多元回归分析,那么产生的结果要比商业税 变量好些:第四列多元相关系数平方是0655比0645(即t=301对t=243)。