高级搜索

食管癌高、低发区食管鳞癌患者生存及其影响因素分析

胡守佳, 范宗民, 岳文彬, 陈培楠, 李秀敏, 李吉林, 韩少华, 王伟, 尹艳春, 宋昕, 赵学科, 王建坡, 王立东

胡守佳, 范宗民, 岳文彬, 陈培楠, 李秀敏, 李吉林, 韩少华, 王伟, 尹艳春, 宋昕, 赵学科, 王建坡, 王立东. 食管癌高、低发区食管鳞癌患者生存及其影响因素分析[J]. 肿瘤防治研究, 2019, 46(9): 829-834. DOI: 10.3971/j.issn.1000-8578.2019.19.0139
引用本文: 胡守佳, 范宗民, 岳文彬, 陈培楠, 李秀敏, 李吉林, 韩少华, 王伟, 尹艳春, 宋昕, 赵学科, 王建坡, 王立东. 食管癌高、低发区食管鳞癌患者生存及其影响因素分析[J]. 肿瘤防治研究, 2019, 46(9): 829-834. DOI: 10.3971/j.issn.1000-8578.2019.19.0139
HU Shoujia, FAN Zongmin, YUE Wenbin, CHEN Peinan, LI Xiumin, LI Jilin, HAN Shaohua, WANG Wei, YIN Yanchun, SONG Xin, ZHAO Xueke, WANG Jianpo, WANG Lidong. Comparison of Survival Status and Related Risk Factors of Esophageal Squamous Cell Carcinoma Patients Between High- and Low-incidence Areas of ESCC[J]. Cancer Research on Prevention and Treatment, 2019, 46(9): 829-834. DOI: 10.3971/j.issn.1000-8578.2019.19.0139
Citation: HU Shoujia, FAN Zongmin, YUE Wenbin, CHEN Peinan, LI Xiumin, LI Jilin, HAN Shaohua, WANG Wei, YIN Yanchun, SONG Xin, ZHAO Xueke, WANG Jianpo, WANG Lidong. Comparison of Survival Status and Related Risk Factors of Esophageal Squamous Cell Carcinoma Patients Between High- and Low-incidence Areas of ESCC[J]. Cancer Research on Prevention and Treatment, 2019, 46(9): 829-834. DOI: 10.3971/j.issn.1000-8578.2019.19.0139

食管癌高、低发区食管鳞癌患者生存及其影响因素分析

基金项目: 

国家自然科学基金 81872032

详细信息
    作者简介:

    胡守佳(1989-),女,博士,医师,主要从事食管、贲门癌变机制和防治的研究

    通讯作者:

    王立东,E-mail: ldwang2007@126.com

  • 中图分类号: R735.1

Comparison of Survival Status and Related Risk Factors of Esophageal Squamous Cell Carcinoma Patients Between High- and Low-incidence Areas of ESCC

More Information
  • 摘要:
    目的 

    探讨食管癌高、低发区食管鳞癌患者的生存状况及其影响因素。

    方法 

    收集38 741例经病理学证实为食管鳞癌患者的资料,其中,高发区患者23 273例(60.1%),低发区15 468例(39.9%)。所有患者均行食管癌根治术。运用卡方检验分析不同临床病理特征患者的组间差异,Kaplan-Meier法绘制不同临床病理特征患者的生存曲线并用Log rank进行检验。多因素Cox比例风险回归模型法分析影响生存的主要因素。

    结果 

    低发区男性患者所占比例高于高发区(P < 0.001),低发区诊断年龄≥50岁食管癌患者所占比例高于高发区(P < 0.001)。高发区食管鳞癌患者的整体生存优于低发区患者(P < 0.001)。Cox比例风险回归模型综合分析结果表明:高低发区、性别、确诊年龄、肿瘤部位、分化程度、TNM分期和肿瘤家族史均是影响食管鳞癌患者生存的独立因素。

    结论 

    高发区食管鳞癌患者整体生存优于低发区;低发区是食管鳞癌患者预后差的独立危险因素。

     

    Abstract:
    Objective 

    To compare the survival condition and related risk factors of the patients with ESCC between high-incidence area (HIA) and low-incidence area (LIA) of ESCC.

    Methods 

    We collected the data of 38741 ESCC patients confirmed by pathology, among which, 23273 cases (60.1%) were from HIA and 15468 cases (39.9%) were from LIA. All patients underwent radical esophagectomy. Chi-square test was used to analyze the differences between groups of the patients with different clinicopathological characteristics, and Kaplan-Meier method was used to draw and Log rank test was used to assess the survival curves of the patients. Cox proportional hazards model was used to analyze the main influencing factors of survival.

    Results 

    The proportion of male patients in LIA was higher than that in HIA (P < 0.001). The proportion of patients ≥50 years old in LIA was also higher than that in HIA (P < 0.001). ESCC patients in HIA had obviously better overall survival than patients in LIA (P < 0.001). HIA/LIA, gender, age at diagnosis, tumor location, differentiation, TNM stage and family history were independent factors for the survival of ESCC patients.

    Conclusion 

    ESCC patients in HIA have obviously higher overall survival than those in LIA. LIA is an independent risk factor for poor survival of ESCC patients.

     

  • 晚期肺癌患者5年生存率仅5%,但若能在早期诊断并治疗,5年存活率可达57%[1-2]。因此,结合肺癌危险因素及其临床特征建立肺癌危险度预测模型对早期诊断及治疗肺癌,提高患者5年生存率具有重要意义。近年来,数据挖掘技术已经在生物医学预测模型中得到广泛应用。人工神经网络(artificial neural network, ANN)具有良好的鲁棒性、高容错性和较强的归纳能力,而C5.0算法作为决策树模型的常用算法之一,适用于分类变量和大数据集[3]。因此,该研究拟将肺癌常见危险因素与临床症状相结合,采用C5.0决策树与ANN构建肺癌危险度预测模型,并评价两模型的性能优劣,为肺癌早期筛查及临床辅助诊断提供依据和工具。

    收集2014年10月至2016年10月郑州大学第一附属医院的住院患者样本420例,其中包括肺癌患者180例,肺良性疾病患者240例。入组患者均知情同意并自愿参加。

    入选标准:肺癌组:以《中华医学会肺癌临床诊疗指南(2019版)》为标准[4],经病理学或细胞学被证实为原发性肺癌患者;肺良性疾病组:由郑州大学第一附属医院诊断为肺部良性病变患者。排除标准:(1)入组前曾接受放化疗、药物治疗或手术治疗者;(2)主要脏器功能衰竭患者;(3)合并肺或其他恶性肿瘤患者;(4)妊娠或哺乳期患者;(5)不同意入组者。

    调查人员经过统一培训后,通过问卷访谈形式对患者进行调查询问获得数据资料,包括流行病学资料(疾病诊断、年龄、吸烟史、饮酒史、粉尘接触史、输血史、肺癌家族史、炎性反应史)和临床症状(咳嗽、咳痰、痰中带血、咯血、胸闷、胸痛、心慌、乏力、畏寒、发热出汗)。其中年龄根据《中华医学会肺癌临床诊疗指南(2019版)》以45岁为界限进行分组。总数据集包括18个定性变量(17个预测变量和1个因变量),因变量为诊断结果,各变量赋值见表 1

    表  1  肺癌危险度评价研究的变量赋值说明
    Table  1  Instructions of variables assignment in risk assessment studies of lung cancer
    下载: 导出CSV 
    | 显示表格

    应用SPSS21.0对420例样本数据进行统计分析,对所有变量进行描述性统计分析,采用χ2检验进行差异分析,检验水准α=0.05。

    使用SPSS Clementine 12.0软件建立两种数据挖掘预测模型,使用MedCalc15.10软件绘制受试者工作特征(receiver operating characteristic curve, ROC)曲线。将两组样本均按照7:3随机分为两部分,其中训练数据集包含302例样本,测试数据集包含118例样本。C5.0决策树模型和ANN模型的比较采用敏感度、特异性、准确度、阳性预测值(positive predictive values, PPV)、阴性预测值(positive and negative predictive values, NPV)、约登指数和ROC曲线下面积(area under ROC curve, AUC)进行评估。

    420例患者中,肺癌患者180例(42.9%),肺良性疾病患者240例(57.1%)。肺良性疾病患者中小于45岁者(63.8%)明显多于肺癌组(36.2%),差异有统计学意义(P=0.004)。肺癌患者中吸烟、饮酒者(57.1%、55.7%)均多于肺良性疾病患者(42.9%、44.3%)。肺癌组有粉尘接触史或肺癌家族史者分别仅2例。肺良性疾病组中有6例有输血史,而肺癌组中没有。10个临床症状变量中,肺癌组中痰中带血(64.0%)及胸痛(55.3%)的比例高于肺良性疾病患者(36.0%、44.7%)。两组样本的基线特征分析结果见表 2

    表  2  肺癌组和肺良性疾病组的样本基线特征及卡方检验(n(%))
    Table  2  Baseline characteristics and chi-square test of lung cancer and lung benign disease groups (n(%))
    下载: 导出CSV 
    | 显示表格

    两组间年龄(P=0.004)、吸烟史(P < 0.001)、饮酒史(P=0.028)、输血史(P=0.033)、炎症史(P < 0.001)、痰中带血(P=0.001)、胸痛(P=0.006)、乏力(P=0.049)和发热出汗(P < 0.001)9个因素差异有统计学意义,见表 2。此外由于既往研究提示粉尘接触史、癌症家族史、咳痰、咳嗽和咯血为肺癌的影响因素[4-5],该研究入选这14个因素作为输入变量建立风险预测模型。

    经过训练,C5.0决策树风险预测模型的参数设置如下:Use partitioned data: no, Output type: Decision Tree, Group symbolic: no, Use boosting: yes, Cross-validate: no, Mode: expert, Pruning severity: 75, Minimum records per child brunch: 2, Use global pruning: yes, Window attributes: no, Use misclassification costs: no。ANN风险预测模型的参数设置如下:Use partitioned data: yes, Method: prune, Prevent overtraining sample: 50%, Set random seed: 321, Stop on: time (mins) 1 min, Optimize: memory, Continue training existing model: no; Use binary set encoding: yes, Show feedback graph: yes, Model selection: Use best network, Mode: expert。

    两种模型训练集和测试集样本的分类结果见表 3。在训练集与测试集样本中C5.0模型的准确率分别为68.54%和61.0%,ANN模型的准确率分别为69.5%和65.3%。可以看出ANN模型在训练集和预测集中准确度均高于C5.0模型。根据两个数据挖掘模型的ROC曲线中各危险因素对应的AUC评估各自变量对模型的影响大小,重要性前10位影响因素排序见表 4。由表可知,对模型影响最大的三个影响因素在ANN模型中分别是吸烟史、痰中带血与胸痛;而在C5.0模型中分别是吸烟史、胸痛与年龄。在ANN模型和C5.0模型中吸烟均为最主要的影响因素。

    表  3  C5.0决策树和ANN模型的训练集和测试集样本分类结果
    Table  3  Classification results of training set and testing set samples by Decision tree C5.0 and ANN models
    下载: 导出CSV 
    | 显示表格
    表  4  C5.0决策树模型和ANN模型中纳入变量的重要性排序
    Table  4  Importance ranking of variables in Decision tree C5.0 model and ANN model
    下载: 导出CSV 
    | 显示表格

    两种数据挖掘模型对肺癌综合预测性能的相关指标包括准确度、约登指数、敏感度、特异性、预测值和AUC。其中C5.0决策树模型的特异性和NPV高于ANN模型,ANN模型预测模型的准确度、约登指数、敏感度、PPV和AUC均高于C5.0决策树模型,见表 5。测试集中两种数据挖掘模型的ROC曲线可发现ANN模型预测性能优于C5.0决策树模型,见图 1

    表  5  两种数据挖掘模型的测试集结果比较
    Table  5  Comparison of testing set results between two data mining models
    下载: 导出CSV 
    | 显示表格
    图  1  测试集中两种数据挖掘模型的ROC曲线
    Figure  1  ROC curves of two data mining models in testing set

    当前,肺癌的高发病率和高病死率已经造成巨大的公共卫生负担,利用肺癌的危险因素来预测肺癌危险度,对于肺癌的预防和早期筛查具有重要意义。本研究分别建立了C5.0决策树与ANN肺癌风险预测模型,比较发现,ANN模型预测性能优于C5.0决策树模型。

    本研究按照0.05的显著性水平,单因素检验发现有9个变量与肺癌患病率呈相关关系:5个流行病学变量中年龄、吸烟史、饮酒史、炎性反应史与肺癌患病率呈正相关,输血史与肺癌患病率呈负相关;4个临床症状中痰中带血、胸痛与肺癌患病率正相关,乏力和发热出汗与肺癌患病率存在负相关关系。同时,本研究的两种数据挖掘模型中吸烟均为关键影响变量。既往研究表明肺癌常见于70岁以上人群且发病率和死亡率随年龄增加而升高,同时吸烟、饮酒以及慢性炎性反应均为肺癌的危险因素之一[5],而围手术期输血对肺癌预后和复发的影响当前研究仍不一致[6],这与本研究结果基本相符。有研究显示,遗传因素与职业性粉尘接触也是肺癌的危险因素之一[7],这与本研究结果不符。

    决策树模型是一种由层次分类逐步构建的贪心算法,作为一种新兴的数据挖掘技术,它可以经过多次迭代演算后得到最优化的算法模型,具有较高的数据分析能力。相关研究已经将C5.0决策树模型用于利用基因表达数据和职业危险因素预测肺癌风险的模型建立[8-10]。C5.0算法作为决策树模型的常用算法之一,适用于分类变量和大数据集,已经在生物医学预测模型的建立中得到广泛应用。另外一些研究将C5.0决策树模型与其他多种研究进行比较,建立疾病风险预测模型,均得到C5.0决策树模型的预测性能最优的结果[11-12]

    ANN模型的数学结构模拟人类大脑的生物神经元学习动态,对输入变量经过训练产生一个加权组合的输出结果。ANN相比于一般统计学方法优势显著,具有良好的鲁棒性、高容错性和较强的归纳能力,可以快速识别线性模型、受阈值影响的非线性模型、分类模型、逐步线性模型,甚至偶然影响,故其可以确定潜在的预后影响因素[13]。已有研究将ANN应用于肺癌风险评估相关模型的构建[3, 14]。该研究结果同样显示ANN模型在准确度、敏感度、约登指数、阳性预测值、ROC曲线下面积均优于决策树模型[15-16],这与相关研究结果一致。因此,本研究建议利用ANN模型结合人群的流行病学资料和临床症状判别肺癌高危人群,为肺癌的早期诊断早期治疗提供参考依据[17]

    本研究仍然存在一定的局限性:一方面,纳入的样本量较少,如果能收集更大样本量和多中心样本资料,样本数据将具有更好的代表性,模型将具有更优异的性能;另一方面,纳入的变量种类有限,而与肺癌相关的危险因素众多且对肺癌存在交互作用,如果能纳入环境因素、职业因素、遗传因素、行为生活方式等多种研究变量,模型将更为准确可靠。因此,我们建议未来的研究应涵盖更大的样本量,纳入更为丰富的研究变量进行综合分析,同时将ANN模型应用于肺癌高危人群中筛查验证。

    作者贡献
    胡守佳:文章撰写
    范宗民:临床随访和数据采集
    岳文彬:资料收集
    陈培楠、李秀敏:英文修改
    李吉林:病理资料核实和质量控制
    韩少华、王伟、尹艳春:临床随访和数据采集
    宋昕、赵学科:数据管理和分析
    王建坡:资料收集
    王立东:课题策划和设计
  • 图  1   不同临床特征食管鳞癌患者的生存曲线

    Figure  1   Overall survival curves of ESCC patients with different clinical characteristics

    表  1   高、低发区食管鳞癌患者临床特征分布(n(%))

    Table  1   Clinical characteristics of ESCC patients in HIA and LIA (n(%))

    下载: 导出CSV

    表  2   食管鳞癌患者生存的多因素Cox比例风险回归模型检验结果

    Table  2   Cox proportional hazards regression model analysis of clinical variables on survival of ESCC patients in HIA and LIA

    下载: 导出CSV

    表  3   不同临床特征的高、低发区食管鳞癌患者生存影响的单因素分析

    Table  3   Univariate analysis of different clinical characteristics on survival of ESCC patients in HIA and LIA

    下载: 导出CSV

    表  4   高发区食管鳞癌患者生存的多因素Cox比例风险回归模型检验结果

    Table  4   Cox proportional hazards regression model analysis of clinical variables on survival of ESCC patients in HIA

    下载: 导出CSV

    表  5   低发区食管鳞癌患者生存的多因素Cox比例风险回归模型检验结果

    Table  5   Cox proportional hazards regression model analysis of clinical variables on survival of ESCC patients in LIA

    下载: 导出CSV
  • [1]

    Lagergren J, Smyth E, Cunningham D, et al. Oesophageal cancer[J]. Lancet, 2017, 390(10110): 2383-2396. doi: 10.1016/S0140-6736(17)31462-9

    [2]

    Lin Y, Totsuka Y, Shan B, et al. Esophageal cancer in high-risk areas of China: research progress and challenges[J]. Ann Epidemiol, 2017, 27(3): 215-221. doi: 10.1016/j.annepidem.2016.11.004

    [3] 王立东, 宋昕.环境和遗传因素交互作用对食管癌发生的影响[J].郑州大学学报(医学版), 2011, 46(1): 1-4. doi: 10.3969/j.issn.1671-6825.2011.01.001

    Wang LD, Song X. Interaction of environmental and hereditary factors on human esophageal carcinogenesis[J]. Zhengzhou Da Xue Xue Bao (Yi Xue Ban), 2011, 46(1): 1-4. doi: 10.3969/j.issn.1671-6825.2011.01.001

    [4]

    Song X, Li WQ, Hu N, et al. GWAS follow-up study of esophageal squamous cell carcinoma identifies potential genetic loci associated with family history of upper gastrointestinal cancer[J]. Sci Rep, 2017, 7(1): 4642. http://pubmedcentralcanada.ca/pmcc/articles/PMC5498542/

    [5] 河南医学院.食管癌[M].北京:人民卫生出版社, 1983: 36.

    Henan Medical College. Esophageal cancer[M]. Beijing: People's Health Publishing House, 1983: 36.

    [6] 汤萨, 黄佳, 董金城, 等.性别对高、低发区食管癌患者生存期的影响[J].肿瘤防治研究, 2014, 41(3): 203-208. doi: 10.3971/j.issn.1000-8578.2014.03.003

    Tang S, Huang J, Dong JC, et al. Effects of gender on survival of patients with esophageal cancer from high- and low-incidence areas[J]. Zhong Liu Fang Zhi Yan Jiu, 2014, 41(3): 203-208. doi: 10.3971/j.issn.1000-8578.2014.03.003

    [7]

    Rowse PG, Jaroszewski DE, Thomas M, et al. Sex disparities after induction chemoradiotherapy and esophagogastrectomy for esophageal cancer[J]. Ann Thorac Surg, 2017, 104(4): 1147-1152. doi: 10.1016/j.athoracsur.2017.05.030

    [8]

    Zeng Y, Ruan W, Liu J, et al. Esophageal cancer in patients under 50: a SEER analysis[J]. J Thorac Dis, 2018, 10(5): 2542-2550. doi: 10.21037/jtd.2018.05.72

    [9] 陈万青.从肿瘤登记数据看中国恶性肿瘤的发病特点和趋势[J].中华健康管理学杂志, 2016, 10(4): 249-252. doi: 10.3760/cma.j.issn.1674-0815.2016.04.001

    Chen WQ. Discussion on the clinical characteristics and trends of cancers in China according to cancer registry data[J]. Zhonghua Jian Kang Guan Li Xue Za Zhi, 2016, 10(4): 249-252. doi: 10.3760/cma.j.issn.1674-0815.2016.04.001

    [10] 王立东, 杜丹凤, 宋昕, 等.食管癌"环境-遗传-基因互作"组学研究:核黄素、核黄素转运基因2和NOTCH1-P53-Rb互作关系[J].郑州大学学报(医学版), 2018, 53(1): 1-5. http://d.old.wanfangdata.com.cn/Periodical_henanykdx201801001.aspx

    Wang LD, Du DF, Song X, et al. Study of environmental-genetics-gene interaction in esophageal cancer: interaction between riboflavin, riboflavin transporter 2 and NOTCH1-P53-Rb[J]. Zhengzhou Da Xue Xue Bao (Yi Xue Ban), 2018, 53(1): 1-5. http://d.old.wanfangdata.com.cn/Periodical_henanykdx201801001.aspx

    [11] 蔡宁, 刘振球, 索晨, 等.食管癌遗传易感基因多态性的研究进展[J].癌症进展, 2018, 16(11): 1331-1334. http://d.old.wanfangdata.com.cn/Periodical/abjbtb201306019

    Cai N, Liu ZQ, Suo C, et al. The research progress of genetic susceptibility gene polymorphism in esophageal cancer[J]. Ai Zheng Jin Zhan, 2018, 16(11): 1331-1334. http://d.old.wanfangdata.com.cn/Periodical/abjbtb201306019

    [12] 郭真真, 刘德祥, 梁锦发, 等. MRI扩散加权成像在非小细胞肺癌靶向治疗早期疗效评价中的应用价值[J].中华介入放射学电子杂志, 2016, 4(2): 100-104. doi: 10.3877/cma.j.issn.2095-5782.2016.02.010

    Guo ZZ, Liu DX, Liang JF, et al. Value of diffusion weighted MRI imaging in early response to target therapy of non-small-cell lung cancer[J]. Zhonghua Jie Ru Fagn She Xue Dian Zi Za Zhi, 2016, 4(2): 100-104. doi: 10.3877/cma.j.issn.2095-5782.2016.02.010

    [13]

    Renz BW, Takahashi R, Tanaka T, et al. β2 adrenergic-neurotrophin feedforward loop promotes pancreatic cancer[J]. Cancer Cell, 2018, 33(1): 75-90. e7. doi: 10.1016/j.ccell.2017.11.007

    [14] 叶圣昌, 刘敏.癌症患者自我感受负担相关影响因素调查及支持性心理治疗效果[J].中国医药导报, 2018, 15(31): 176-180. http://d.old.wanfangdata.com.cn/Periodical/yycyzx201831045

    Ye SC, Liu M. Related factors survey of self perceived burden of cancer patients and effect of supportive psychotherapy[J]. Zhongguo Yi Yao Dao Bao, 2018, 15(31): 176-180. http://d.old.wanfangdata.com.cn/Periodical/yycyzx201831045

    [15]

    Speicher PJ, Englum BR, Ganapathi AM, et al. Traveling to a high-volume center is associated with improved survival for patients with esophageal cancer[J]. Ann Surg, 2017, 265(4): 743-749. doi: 10.1097/SLA.0000000000001702

  • 期刊类型引用(1)

    1. 黄普超,原慧洁,张桂芳. 基于数据挖掘技术的肺癌危险度预测模型的构建. 实用预防医学. 2022(11): 1390-1394 . 百度学术

    其他类型引用(2)

图(1)  /  表(5)
计量
  • 文章访问数:  1274
  • HTML全文浏览量:  380
  • PDF下载量:  637
  • 被引次数: 3
出版历程
  • 收稿日期:  2019-02-10
  • 修回日期:  2019-05-11
  • 网络出版日期:  2024-01-12
  • 刊出日期:  2019-09-24

目录

/

返回文章
返回
x 关闭 永久关闭