医学论文
论文网 > 医学论文

BP神经网络在生存分析中的应用

2019-12-10 21:27:07

医学论文网发布BP神经网络在生存分析中的应用,更多BP神经网络在生存分析中的应用相关论文,请访问论文发表网医学论文栏目。

                 作者:李丽霞,郜艳晖,张丕德,张瑛,邹宇华 

【摘要】   目的 探讨BP神经 网络 在生存 分析 中的 应用 。 方法 通过贲门癌预后的实例说明神经网络的连续时间模型与离散时间模型的使用。结果 所建立的神经网络生存分析模型有较好的预测能力。 结论 神经网络在生存分析中有很大的灵活性,在模型中可以容纳非线性效应,协变量的效应可以随时间而变化,不要求满足PH假定,有较广泛的应用前景。

【关键词】   BP神经网络;生存分析;贲门癌

  Abstract:Objective To explore the application of BP neural network in the survival analysis.Method Three approaches have been illustrated how to fit survival model for carcinoma of the gastric cardia.Results The neural network models have good predictive ability.Conclusion  BP neural network is very flexible without making assumption of proportionality of hazards,it can allow non-linear predictors and the effect of the covariates to vary over time,so it has broad application prospects.

  Key words:BP neural network; survival analysis; carcinoma of the gastric cardia

  生存分析(survival analysis)起源于19世纪对寿命表的分析, 目前 已广泛应用到临床 研究 中,可以处理含有删失值的数据,可以同时考虑事件发生的结局及发生结局的时间。目前处理生存资料的方法有参数模型、非参数模型及半参数模型。参数模型对生存时间的分布要求非常严格,医学资料中很少能满足;生存分析中传统的回归模型,例如:Cox比例风险模型、加速失效时间模型也要求模型满足一定的假设前提,而实际数据往往难以满足这些假设。神经网络近年来受到普遍的关注,在医学领域中的应用主要预测与分类,与传统回归模型不同,它可以克服这些缺点,在模型中可以容纳非线性效应,交互效应、协变量的效应可以随时间变化。目前国内研究神经网络在生存分析中的应用尚较少,本文拟探讨几种不同的神经网络生存模型在贲门癌预后中的应用。

  1  方法
   
  BP神经网络是目前应用最多的神经网络,一般由一个输入层(input layer)、一个输出层(output layer)、一个或几个中间层(隐层)组成,每一层可包含一个或多个神经元,其中每一层的每个神经元和前一层相连接,同一层之间没有连接。输入层神经元传递输入信息到第一隐层或直接传到输出层,隐层的神经元对输入层的信息加权求和,加一个常数后,经传递函数运算后传到下一个隐层(或输出层),常用的传递函数是logistic函数,即φh=1/(1+exp (-z)),输出层神经元对前一层的输入信息加权求和经传递函数φ0(线性或logistic函数或门限函数)运算后输出,例如:如果输入为xi,对于含一个隐层的神经网络可以得到:

  g(xi,θ)=φ0(αk+∑i≠kwikxi+∑jwjkφh(αj+∑iwijxi))(1)
   
  θ表示未知的参数矢量(即各层的网络权值),BP神经网络一般采用BP算法训练网络,训练开始时选择初始值0,BP算法通过梯度下降法得到估计值,使得g(x,)能很好地估计实测值,关于BP算法及改进可 参考 相关 文献 [1]。
      
  利用BP神经网络模型建立生存分析模型,常用的方法有:连续时间模型(continuous time models)与离散时间模型(discrete time models)。

  1.1  连续时间模型(continuous time models)
      
  最常用的是Faraggi和Simon[2]提出的方法,在Cox比例风险模型中,风险函数与时间、协变量有如下关系:

  h(t,xi)=h0(t)exp (βxi)(2)
   
  通过最大化偏似然函数,使用Newton-Raphson法得到参数的估计值,现在使用神经网络的输出值g(xi,θ)来代替(2)中的线性项 βxi,比例风险模型变成h(t,xi)=h0(t)exp [g(xi,θ)],有偏似然函数:

  Lc(θ)=∏i∈uexp ∑jwjk/(1+exp (-wijxi))/∑j∈Riexp ∑jwjk/(1+exp (-wijxj))(3)
   
  g(xi,θ)可以依赖时间和协变量变化,也就是说协变量的效应可以随时间而变化,这给我们提供了一个可以处理删失变量但又不需要满足比例风险模型的PH假定的可供选择的方法。

  1.2  离散时间模型(discrete time models)
   
  常用的模型有[3]:(1)直接预测患者是否可以存活到某年(例如5年),是最简单的神经网络模型,模型的输出层只有一个神经元结点,如欲预测多个时间点,则需建立多个神经网络模型(每个模型对应一个时间区间);(2)多个输出结点的单个神经网络模型。

  1.2.1  输出层有单个结点的神经网络模型  是一个标准的分类神经网络模型,生存时间被分成2个区间,例如生存时间是否大于5年。其似然函数为:
 
  ∏patientsptii(1-pi)(1-ti)

  其对数似然函数为:
 
  ∑patientstilog pi+(1-ti)log (1-pi)
   
  pi:第i个病人死亡的概率,ti:第i个观测在某时间点(例如5年)的结果,如观测死亡,取值为1,否则取值为0。对于删失的观测不能简单地排除,这样会造成偏性,我们使用Cox线性比例风险模型产生的个体预测值对删失值做填补。

转贴于论文联盟 http://www.lwlm.com
录入:xiaohua
相关推荐