|
(摘要:本文全面深入讨论了人口分析技术与遗传算法相结合的年龄别生育率与总和生育率间接估计方法,并以人口普查数据为例充分展示年龄别生育率与总和生育率间接估计方法的建模过程与实施步骤,同时指出今后有待深入研究的问题。
关键词:遗传算法 年龄别生育率 总和生育率 间接估计)
1.引言
年龄别生育率与总和生育率是人口研究的重要指标。年龄别生育率不仅可以从生育模式的角度反映育龄妇女的生育过程,而且可以从生育水平的角度反映育龄妇女的生育状况。按研究问题角度不同对生育水平的测度可以分为队列和时期两种方法。按队列分析育龄妇女的生育水平是对特定队列妇女生育史的回顾,通过队列年龄别生育率可以得到相应队列的终身生育率或队列总和生育率。队列年龄别生育率和队列终身生育率较好地反映了妇女的生育史。按时期指标分析育龄妇女的生育水平则是对特定时期妇女生育状况的研究。时期年龄别生育率与总和生育率从生育模式和生育水平两个方面来反映特定时期育龄妇女的生育状况,是以假想队列为前提的。因此,在反映生育模式和生育水平变化的过程中离不开对年龄别生育率和总和生育率的评判,尤其是反映时期综合生育指标--总和生育率已成为人口与计划生育研究的指示性指标,在人口与计划生育研究过程中起着举足轻重的作用。对生育率的研究,特别是对总和生育率的研究一直是人口研究的重中之重。无论是从应用人口分析的研究角度看,还是从人口分析数学方法的研究的角度看,对时期年龄别生育率和总和生育率的研究一直都是人口研究工作的重点,研究文献不胜枚举。特别是1998年邦加茨和费尼《生育的数量与进度》一文发表以来(Bongaarts,
J., et al,1998),从方法论角度再次引起了人们对生育率研究的高度重视和广泛的兴趣(郭志刚,2000;郭震威,2000)。然而,纵观生育率研究方法可以看到,目前对生育率的研究往往需要大量的数据,缺乏基于少量高质量数据前提下对时期年龄别生育率和总和生育率变化过程进行间接估计方法的研究。对时期年龄别生育率与总和生育率变化过程的间接估计不仅有利于深入分析人口系统的生育行为与过程,而且有利于对现有数据进行深入数据挖掘,因此是一项具有广泛应用前景和重要意义的研究。本文试图以人口分析技术与现代遗传算法相结合对时期年龄别生育率和总和生育率的状况及其变化过程进行间接估计,以期对相关研究提供参考。
2. 方法
从现有研究文献看,对时期总和生育率可以通过一般生育率(GFR)或粗出生率(CBR)与总和生育率的近似关系,即:
等方法对总和生育率进行简捷的近似计算(David P. Smith,1992),但由于其假设条件太强或近似程度相对较差,因此在生育研究过程中受到一定的限制。可是,生育水平经常成为研究者和政策制定者关注与争论的焦点,其根本原因不仅与生育率在人口系统中的重要地位密切相关,而且还与人口调查数据质量密切相关。正是由于上述原因,经常发生对生育水平评判的争论。此外,从研究的角度看,在对生育水平的争论过程中,生育水平研究方法的相对欠缺应该负有一定的责任。因此除了直接调查外,有效的间接估计方法就显得非常重要。可见,对总和生育率研究方法的研究需要进一步加强,尤其是间接估计方法的研究应该引起足够的重视。与对总和生育率的间接估计或近似计算的稍有不同,虽然也有通过标准生育表方法对年龄别生育率进行间接估计的方法,但由于对时期年龄别生育率的间接估计必须采用标准生育模式和被估计时点部分年龄组年龄别生育率数据,因此现有方法在应用上受到限制(Samuel
H. Preston, et al,2001)。此外,还可以运用亲生子女等方法对年龄别生育率进行间接估计,但由于所需数据是以个体记录为研究单位,需要进行大规模的数据匹配,在具体运用过程中由于原始数据的不易获得而受到限制。如果降低对高质量数据的依赖程度,以一次调查汇总数据为基础对年龄别生育率及其变化过程的研究,由于使用数据量较小,常规估计方法很难得到满意和可靠的结果,所以探索新途径进行有效的间接估计显得非常重要。正是由于使用一次调查数据对年龄别生育率间接估计方法难度相对较大和过于复杂等原因,到目前为止,尚未见相关研究成果的发表。
本项研究试图以一次调查数据,如一次普查数据,将人口分析技术与现代遗传优化建模方法相结合对年龄别生育率与总和生育率进行间接估计。具体对时期年龄别生育率和总和生育率的间接估计方法可以划分为三个组成部分,即倒推育龄妇女年龄结构和出生人口数(通过人口回溯获得理论出生人口数)、出生人口预测和遗传算法优化求解三个部分。在上述三个部分中,人口回溯模型解决各年度育龄妇女年龄结构和理论出生人口数的间接估计问题;通过遗传算法得到年龄别生育率和育龄妇女年龄结构相结合可以建立年龄别生育率与模型预测出生人口数之间的相互关系;将理论出生人口数与模型预测出生人口相结合得到遗传算法评估函数,解决遗传算法的目标优化问题,通过评估函数筛选得到最优年龄别生育率。
2.1 年龄别育龄妇女人口数与出生人口数间接估计
由于可以获得的人口数据可能是一次人口调查资料,也可能是两次调查的数据。对育龄妇女年龄结构和出生人口数的估计可以利用一次人口调查数据对以往人口年龄结构的进行回溯,也就是采取“存活倒推法”进行。该方法是根据年龄别人口存活概率和现有人口结构对历史人口进行推测,通过回溯方法估算各年份年龄别人口数。年龄别人口数回溯方法的具体算法为:
; 式中 是在t1时刻年龄在x岁至x+n岁的人口数; 是在t2时刻年龄在x+n岁至x+2n岁的人口数;
为确切年龄在x至x+n队列存活人年数;为确切年龄在x+n至x+2n队列存活人年数。具体年龄别人口间接估计方法见参考文献[8][9]。
2.2 基于遗传算法年龄别生育率与总和生育率间接估计优化模型
2.2.1 遗传算法
遗传算法(Genetic Algorithms)是以生物进化机制为基础,通过计算机数值模拟方法来构造人工系统仿真模型,是计算机科学与生物进化理论相结合的产物。
早在20世纪50年代和60年代,计算机科学家开始尝试将生物进化理论与思想引入计算机优化计算。20世纪60年代中期,美国Michigan大学的John
Holland在前人研究工作的基础上提出了位串编码技术,该技术完全适用于生物进化的变异操作和交叉(杂交)操作。正是由于Holland提出通用编码技术和简单有效的遗传操作为遗传算法的广泛成功应用奠定了基础。经过近30年的不懈努力,遗传算法不仅已经发展成为解决复杂全局优化问题的重要方法,而且在很多研究领域的具体科学实践中得到广泛的应用并获得成功。遗传算法基本步骤见图1。
图1 遗传算法流程图
|