原文链接:http://tecdat.cn/?p=17347

最近我们被客户要求撰写关于Lee-Carter模型的研究报告,包括一些图形和统计输出。

昨天上午,我们获得了分娩产妇的平均年龄两个图表,根据孩子的出生顺序排序,区间是1905-1965年

图片

然后是1960-2000年:

图片


点击标题查阅往期内容

图片

R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例

图片

左右滑动查看更多

图片

01

图片

02

图片

03

图片

04

图片

 

这些图形令人兴奋,特别是在过去30年中观察到的增长方面,这使我想到了寿命的增长趋势。我们可以找到其他有趣的数据(在这种情况下为平均 出生年龄 )。


> age$Age=as.character(age$AGE)
> age$AGE=as.numeric(substr(age$Age,1,2))+
+ as.numeric(substr(age$Age,4,4))/10
> plot(age$ANNEE+.5,age$AGE,
+ type="l",lwd=2,col="blue")

我们在上面的图中发现深蓝色的曲线,

图片

 

获取祖母的平均年龄,我们进一步分析


> tail(age)
      AGE   Age NAIS.MERE NAIS.GRD.MERE age.GRD.MERE
2000  2000 30.3 30,3     1970.2       1942.87        57.63
2001  2001 30.4 30,4     1971.1       1943.80        57.70
2002  2002 30.4 30,4     1972.1       1944.92        57.58
2003  2003 30.5 30,5     1973.0       1945.95        57.55
2004  2004 30.5 30,5     1974.0       1947.05        57.45
2005  2005 30.6 30,6     1974.9       1948.04        57.46
> plot(age$ANNEE+.5,age$age.GRD.MERE,
+ type="l",lwd=2,col="red")

再一次,我们可以形象地看到外婆的出生年龄

图片

 

我们可以通过使用Lee-Carter模型对年死亡率进行建模,并推断到当前世纪,我们可以推断出期望剩余寿命。

> Deces <- read.table("Dec.txt",header=TRUE)
> Expo  <- read.table("Expo.txt",header=TRUE,skip=2)
> Deces$Age <- as.nu
> Expo$Age <- as.numeric(as.character(Expo$Age))
> Expo$Age[is.n
Deces$Female/Expo$Female,nL,nC)
>  POPF <- matrix(Expo$Female,nL,nC)
>  BASEF <- demogdata(data=MUF, pop=POPF,ages=AGE,
+ years=YEAR, t
> K1 <- LCF$kt
nction(xentier,T){

+ return(ext) }
> EVIE = function(x,T){
+ x1 <- trunc(x)
> tail(age)
     AGE   Age NAIS.MERE NAIS.GRD.MERE age.GRD.MERE       EV
2000 30.3 30,3     1970.2       1942.87        57.63 29.13876
2001 30.4 30,4     1971.1       1943.80        57.70 29.17047
2002 30.4 30,4     1972.1       1944.92        57.58 29.39027
2003 30.5 30,5     1973.0       1945.95        57.55 29.52041
2004 30.5 30,5     1974.0       1947.05        57.45 29.72511
2005 30.6 30,6     1974.9       1948.04        57.46 29.80398

换句话说,在最后一行,2005年,一名57.46岁女性的(剩余)期望寿命约为29.80岁。然后,我们不仅可以看到他祖母的平均年龄,还可以看到她的剩余期望寿命,

图片

 

然后我们就可以确定曾祖母的(平均)年龄,

 

图片

以及曾祖母的(剩余)寿命

图片

 

现在我们也可以对这项快速研究的局限性感到疑惑。特别是,正如有配偶的寿命之间存在很强的相关性,我们可能会问,孩子和孙子的出生是否具有对一个人的剩余生命的影响(或者我们是否可以像这样假设独立性)。


图片

点击文末 “阅读原文”

获取全文完整代码数据资料。

本文选自《R语言Lee-Carter模型对年死亡率建模预测预期寿命》。

点击标题查阅往期内容

R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例
R语言分布滞后非线性模型(DLNM)空气污染研究温度对死亡率影响建模应用
R语言分布滞后线性和非线性模型(DLM和DLNM)建模
分布滞后线性和非线性模型(DLNM)分析空气污染(臭氧)、温度对死亡率时间序列数据的影响
R语言中的分布滞后非线性模型DLNM与发病率和空气污染示例
【视频】R语言中的分布滞后非线性模型(DLNM)与发病率,死亡率和空气污染示例
R语言分布滞后线性和非线性模型(DLNM)分析空气污染(臭氧)、温度对死亡率时间序列数据的影响
R语言分布滞后线性和非线性模型(DLMs和DLNMs)分析时间序列数据
R语言分布滞后非线性模型(DLNM)空气污染研究温度对死亡率影响建模应用R语言分布滞后非线性模型(DLNM)研究发病率,死亡率和空气污染示例R语言Lee-Carter模型对年死亡率建模预测预期寿命
R语言预测人口死亡率:用李·卡特(Lee-Carter)模型、非线性模型进行平滑估计
Tableau 数据可视化:探索性图形分析新生儿死亡率数据
R语言模拟人类生活预期寿命动态可视化动画图gif
r语言绘制动态统计图:绘制世界各国的人均GDP,出生时的预期寿命和人口气泡图动画动态gif图
R语言非参数模型厘定保险费率:局部回归、广义相加模型GAM、样条回归
R语言小数定律的保险业应用:泊松分布模拟索赔次数
R语言对巨灾风险下的再保险合同定价研究案例:广义线性模型和帕累托分布Pareto distributions分析
R语言中的广义线性模型(GLM)和广义相加模型(GAM):多元(平滑)回归分析保险资金投资组合信用风险敞口


拓端tecdat
195 声望47 粉丝