Expression of TOPⅡα, TP53 and HER2 in Gastric Adenocarcinoma and Their Clinical Significance
-
摘要:目的
检测胃腺癌组织中TOPⅡα、TP53和HER2的表达,探讨其表达的相关性及与胃腺癌患者临床病理特征的关系。
方法免疫组织化学法检测136例胃腺癌及20例正常胃黏膜石蜡标本中TOPⅡα、TP53和HER2蛋白的表达,SPSS20.0软件分析三者之间的相关性及与胃腺癌患者临床病理特征的关系。
结果(1)136例胃腺癌标本中,TOPⅡα和TP53的阳性表达率分别是47.1%(64/136)和65.4%(89/136),HER2阳性扩增率为23.5%(32/136);(2)TOPⅡα和P53的表达均与胃腺癌分化程度及Lauren分型显著相关(P < 0.05),HER2的阳性扩增与肿瘤的分化、Lauren分型以及临床TNM分期显著相关(P < 0.05);(3)TP53同TOPⅡα及HER2均有显著相关性(r=0.326, P=0.000; r=0.212, P=0.012)。
结论联合检测胃腺癌组织中TOPⅡα、TP53和HER2蛋白表达有利于评估胃腺癌的生物学特性和预测患者的预后。
Abstract:ObjectiveTo detect the expression of TOPⅡα, TP53 and HER2 in gastric adenocarcinoma tissuses, and to explore their inner relationship as well as their relationship with the clinicopathological characteristics of gastric adenocarcinoma patients.
MethodsImmunohistochemical method was used to detect the expression of TOPⅡα, TP53 and HER2 in 136 cases of gastric adenocarcinoma and 20 cases of normal gastric mucosa tissues. The correlation among the three biomarkers and their relationships with the clinicopathological characteristics were analyzed by SPSS20.0 software.
Results(1) The positive expression rates of TOPⅡα and TP53 in 136 cases of gastric adenocarcinoma specimens were 47.1%(64/136) and 65.4%(89/136), respectively. HER2 positive amplification rate was 23.5% (32/136); (2) The expression of TOPⅡα and TP53 were correlated significantly with the differentiation and Lauren types of gastric adenocarcinoma(P < 0.05). HER2 positive amplification was significantly correlated with tumor differentiation, Lauren types and clinical TNM stage (P < 0.05); (3) The expressions of TP53 and TOPⅡα, as well as TP53 and HER2 amplification, were significantly correlated, respectively (r=0.326, P=0.000; r=0.212, P=0.012).
ConclusionCombined detection of these three biomarkers is helpful for evaluating the biological characteristic of gastric adenocarcinoma and predicting the prognosis of patients.
-
Key words:
- Gastric adenocarcinoma /
- TOPⅡα /
- TP53 /
- HER2 /
- Correlation
-
0 引言
晚期肺癌患者5年生存率仅5%,但若能在早期诊断并治疗,5年存活率可达57%[1-2]。因此,结合肺癌危险因素及其临床特征建立肺癌危险度预测模型对早期诊断及治疗肺癌,提高患者5年生存率具有重要意义。近年来,数据挖掘技术已经在生物医学预测模型中得到广泛应用。人工神经网络(artificial neural network, ANN)具有良好的鲁棒性、高容错性和较强的归纳能力,而C5.0算法作为决策树模型的常用算法之一,适用于分类变量和大数据集[3]。因此,该研究拟将肺癌常见危险因素与临床症状相结合,采用C5.0决策树与ANN构建肺癌危险度预测模型,并评价两模型的性能优劣,为肺癌早期筛查及临床辅助诊断提供依据和工具。
1 资料与方法
1.1 研究对象
收集2014年10月至2016年10月郑州大学第一附属医院的住院患者样本420例,其中包括肺癌患者180例,肺良性疾病患者240例。入组患者均知情同意并自愿参加。
入选标准:肺癌组:以《中华医学会肺癌临床诊疗指南(2019版)》为标准[4],经病理学或细胞学被证实为原发性肺癌患者;肺良性疾病组:由郑州大学第一附属医院诊断为肺部良性病变患者。排除标准:(1)入组前曾接受放化疗、药物治疗或手术治疗者;(2)主要脏器功能衰竭患者;(3)合并肺或其他恶性肿瘤患者;(4)妊娠或哺乳期患者;(5)不同意入组者。
1.2 观察指标
调查人员经过统一培训后,通过问卷访谈形式对患者进行调查询问获得数据资料,包括流行病学资料(疾病诊断、年龄、吸烟史、饮酒史、粉尘接触史、输血史、肺癌家族史、炎性反应史)和临床症状(咳嗽、咳痰、痰中带血、咯血、胸闷、胸痛、心慌、乏力、畏寒、发热出汗)。其中年龄根据《中华医学会肺癌临床诊疗指南(2019版)》以45岁为界限进行分组。总数据集包括18个定性变量(17个预测变量和1个因变量),因变量为诊断结果,各变量赋值见表 1。
表 1 肺癌危险度评价研究的变量赋值说明Table 1 Instructions of variables assignment in risk assessment studies of lung cancer1.3 统计学方法
应用SPSS21.0对420例样本数据进行统计分析,对所有变量进行描述性统计分析,采用χ2检验进行差异分析,检验水准α=0.05。
使用SPSS Clementine 12.0软件建立两种数据挖掘预测模型,使用MedCalc15.10软件绘制受试者工作特征(receiver operating characteristic curve, ROC)曲线。将两组样本均按照7:3随机分为两部分,其中训练数据集包含302例样本,测试数据集包含118例样本。C5.0决策树模型和ANN模型的比较采用敏感度、特异性、准确度、阳性预测值(positive predictive values, PPV)、阴性预测值(positive and negative predictive values, NPV)、约登指数和ROC曲线下面积(area under ROC curve, AUC)进行评估。
2 结果
2.1 基本情况
420例患者中,肺癌患者180例(42.9%),肺良性疾病患者240例(57.1%)。肺良性疾病患者中小于45岁者(63.8%)明显多于肺癌组(36.2%),差异有统计学意义(P=0.004)。肺癌患者中吸烟、饮酒者(57.1%、55.7%)均多于肺良性疾病患者(42.9%、44.3%)。肺癌组有粉尘接触史或肺癌家族史者分别仅2例。肺良性疾病组中有6例有输血史,而肺癌组中没有。10个临床症状变量中,肺癌组中痰中带血(64.0%)及胸痛(55.3%)的比例高于肺良性疾病患者(36.0%、44.7%)。两组样本的基线特征分析结果见表 2。
表 2 肺癌组和肺良性疾病组的样本基线特征及卡方检验(n(%))Table 2 Baseline characteristics and chi-square test of lung cancer and lung benign disease groups (n(%))2.2 输入变量的选择
两组间年龄(P=0.004)、吸烟史(P < 0.001)、饮酒史(P=0.028)、输血史(P=0.033)、炎症史(P < 0.001)、痰中带血(P=0.001)、胸痛(P=0.006)、乏力(P=0.049)和发热出汗(P < 0.001)9个因素差异有统计学意义,见表 2。此外由于既往研究提示粉尘接触史、癌症家族史、咳痰、咳嗽和咯血为肺癌的影响因素[4-5],该研究入选这14个因素作为输入变量建立风险预测模型。
2.3 危险度预测模型的构建与比较
2.3.1 两种风险预测模型的建立
经过训练,C5.0决策树风险预测模型的参数设置如下:Use partitioned data: no, Output type: Decision Tree, Group symbolic: no, Use boosting: yes, Cross-validate: no, Mode: expert, Pruning severity: 75, Minimum records per child brunch: 2, Use global pruning: yes, Window attributes: no, Use misclassification costs: no。ANN风险预测模型的参数设置如下:Use partitioned data: yes, Method: prune, Prevent overtraining sample: 50%, Set random seed: 321, Stop on: time (mins) 1 min, Optimize: memory, Continue training existing model: no; Use binary set encoding: yes, Show feedback graph: yes, Model selection: Use best network, Mode: expert。
2.3.2 两种危险度预测模型的性能比较
两种模型训练集和测试集样本的分类结果见表 3。在训练集与测试集样本中C5.0模型的准确率分别为68.54%和61.0%,ANN模型的准确率分别为69.5%和65.3%。可以看出ANN模型在训练集和预测集中准确度均高于C5.0模型。根据两个数据挖掘模型的ROC曲线中各危险因素对应的AUC评估各自变量对模型的影响大小,重要性前10位影响因素排序见表 4。由表可知,对模型影响最大的三个影响因素在ANN模型中分别是吸烟史、痰中带血与胸痛;而在C5.0模型中分别是吸烟史、胸痛与年龄。在ANN模型和C5.0模型中吸烟均为最主要的影响因素。
表 3 C5.0决策树和ANN模型的训练集和测试集样本分类结果Table 3 Classification results of training set and testing set samples by Decision tree C5.0 and ANN models表 4 C5.0决策树模型和ANN模型中纳入变量的重要性排序Table 4 Importance ranking of variables in Decision tree C5.0 model and ANN model两种数据挖掘模型对肺癌综合预测性能的相关指标包括准确度、约登指数、敏感度、特异性、预测值和AUC。其中C5.0决策树模型的特异性和NPV高于ANN模型,ANN模型预测模型的准确度、约登指数、敏感度、PPV和AUC均高于C5.0决策树模型,见表 5。测试集中两种数据挖掘模型的ROC曲线可发现ANN模型预测性能优于C5.0决策树模型,见图 1。
表 5 两种数据挖掘模型的测试集结果比较Table 5 Comparison of testing set results between two data mining models3 讨论
当前,肺癌的高发病率和高病死率已经造成巨大的公共卫生负担,利用肺癌的危险因素来预测肺癌危险度,对于肺癌的预防和早期筛查具有重要意义。本研究分别建立了C5.0决策树与ANN肺癌风险预测模型,比较发现,ANN模型预测性能优于C5.0决策树模型。
本研究按照0.05的显著性水平,单因素检验发现有9个变量与肺癌患病率呈相关关系:5个流行病学变量中年龄、吸烟史、饮酒史、炎性反应史与肺癌患病率呈正相关,输血史与肺癌患病率呈负相关;4个临床症状中痰中带血、胸痛与肺癌患病率正相关,乏力和发热出汗与肺癌患病率存在负相关关系。同时,本研究的两种数据挖掘模型中吸烟均为关键影响变量。既往研究表明肺癌常见于70岁以上人群且发病率和死亡率随年龄增加而升高,同时吸烟、饮酒以及慢性炎性反应均为肺癌的危险因素之一[5],而围手术期输血对肺癌预后和复发的影响当前研究仍不一致[6],这与本研究结果基本相符。有研究显示,遗传因素与职业性粉尘接触也是肺癌的危险因素之一[7],这与本研究结果不符。
决策树模型是一种由层次分类逐步构建的贪心算法,作为一种新兴的数据挖掘技术,它可以经过多次迭代演算后得到最优化的算法模型,具有较高的数据分析能力。相关研究已经将C5.0决策树模型用于利用基因表达数据和职业危险因素预测肺癌风险的模型建立[8-10]。C5.0算法作为决策树模型的常用算法之一,适用于分类变量和大数据集,已经在生物医学预测模型的建立中得到广泛应用。另外一些研究将C5.0决策树模型与其他多种研究进行比较,建立疾病风险预测模型,均得到C5.0决策树模型的预测性能最优的结果[11-12]。
ANN模型的数学结构模拟人类大脑的生物神经元学习动态,对输入变量经过训练产生一个加权组合的输出结果。ANN相比于一般统计学方法优势显著,具有良好的鲁棒性、高容错性和较强的归纳能力,可以快速识别线性模型、受阈值影响的非线性模型、分类模型、逐步线性模型,甚至偶然影响,故其可以确定潜在的预后影响因素[13]。已有研究将ANN应用于肺癌风险评估相关模型的构建[3, 14]。该研究结果同样显示ANN模型在准确度、敏感度、约登指数、阳性预测值、ROC曲线下面积均优于决策树模型[15-16],这与相关研究结果一致。因此,本研究建议利用ANN模型结合人群的流行病学资料和临床症状判别肺癌高危人群,为肺癌的早期诊断早期治疗提供参考依据[17]。
本研究仍然存在一定的局限性:一方面,纳入的样本量较少,如果能收集更大样本量和多中心样本资料,样本数据将具有更好的代表性,模型将具有更优异的性能;另一方面,纳入的变量种类有限,而与肺癌相关的危险因素众多且对肺癌存在交互作用,如果能纳入环境因素、职业因素、遗传因素、行为生活方式等多种研究变量,模型将更为准确可靠。因此,我们建议未来的研究应涵盖更大的样本量,纳入更为丰富的研究变量进行综合分析,同时将ANN模型应用于肺癌高危人群中筛查验证。
-
表 1 TOP Ⅱα, TP53表达及HER2基因扩增同胃腺癌患者临床病理特征的相关性
Table 1 Correlation of TOPⅡα, TP53 protein expression and HER2 amplification with clinicopathological parameters of gastric adenocarcinoma patients
-
[1] 《胃癌HER2检测指南(2016版)》专家组.胃癌HER2检测指南(2016版)[J].中华病理学杂志, 2016, 45(8): 528-32. doi: 10.3760/cma.j.issn.0529-5807.2016.08.007 Guideline Recommendations for HER2 Detection in Gastric Cancer Group. Guidelines for HER2 detection in gastric cancer (2016)[J]. Zhonghua Bing Li Xue Za Zhi, 2016, 45(8): 528-32. doi: 10.3760/cma.j.issn.0529-5807.2016.08.007
[2] Qiao JH, Jiao DC, Lu ZD, et al. Clinical significance of topoisomerase 2A expression and gene change in operable invasive breast cancer[J]. Tumour Biol, 2015, 36(9): 6833-8. doi: 10.1007/s13277-015-3390-6
[3] 赵向前, 梁斌, 张安红, 等.壶腹癌中Ki-67和Top oⅡα的表达及意义[J].中华临床医师杂志(电子版), 2015, 9(2): 214-7. http://d.old.wanfangdata.com.cn/Periodical/zhlcyszz201502008 Zhao XQ, Liang B, Zhang AH, et al. Expression and significance of Ki-67, TopoisomeraseⅡα in ampullary carcinoma[J]. Zhonghua Lin Chuang Yi Shi Za Zhi(Dian Zi Ban), 2015, 9(2): 214-7. http://d.old.wanfangdata.com.cn/Periodical/zhlcyszz201502008
[4] Vousden KH, Prives C. Blinded by the Light: The Growing Complexity of p53[J]. Cell, 2009, 137(3): 413-31. doi: 10.1016/j.cell.2009.04.037
[5] Gazdar AF, Bunn PA, Minna JD. Small-cell lung cancer: what we know, what we need to know and the path forward[J]. Nat Rev Cancer, 2017, 17(12): 725-37. doi: 10.1038/nrc.2017.87
[6] Zhou F, Xu Y, Shi J, et al. Expression profile of E-cadherin, estrogen receptors, and P53 in early-onset gastric cancers[J]. Cancer Med, 2016, 5(12): 3403-11. doi: 10.1002/cam4.931
[7] Kunizaki M, Fukuda A, Wakata K, et al. Clinical Significance of Serum p53 Antibody in the Early Detection and Poor Prognosis of Gastric adenocarcinoma[J]. Anticancer Res, 2017, 37(4): 1979-84. doi: 10.21873/anticanres
[8] Ayed DB, Khabir A, Abid M, et al. Clinicopathological and prognostic significance of p53, Ki-67, and Bcl-2 expression in Tunisian gastric adenocarcinomas[J]. Acta Histochem, 2014, 116(8): 1244-50. doi: 10.1016/j.acthis.2014.07.008
[9] Chua TC, Merrett ND. Clinicopathologic factors associated with HER2-positive gastric camcer and its impact on survival outcomes-a systematic review[J]. Int J Cancer, 2012, 130(12): 2845-56. doi: 10.1002/ijc.26292
[10] Gomez-Martin C, Plaza JC, Pazo-Cid R, et al. Level of HER2 gene amplification predicts response and overall survival in HER2-positive advanced gastric cancer treated with trastuzumab[J]. J Clin Oncol, 2013, 31(35): 4445-2. doi: 10.1200/JCO.2013.48.9070
[11] Sanford M. Trastuzumab: a review of its use in HER2-positive advanced gastric cancer[J]. Drugs, 2013, 73(14): 1605-15. doi: 10.1007/s40265-013-0119-y
[12] Bang YJ, Van Cutsem E, Feyereislova A, et al. Trastuzumab in combination with chemotherapy versus chemotherapy alone for treatment of HER2-positive advanced gastric or gastro-oesophageal junction cancer(ToGA): a phase 3, open-label, randomised controlled trial[J]. Lancet, 2010, 376(9742): 687-97. doi: 10.1016/S0140-6736(10)61121-X
[13] 黄必军, 朱振宇, 梁启万, 等.肝细胞癌中p53基因的缺失与HER-2基因的扩增及其意义[J].中华病理学杂志, 2003, 32(1): 20-4. doi: 10.3760/j.issn:0529-5807.2003.01.005 Huang BJ, Zhu ZY, Liang QW, et al. Loss of p53 gene and amplification of HER-2 oncogene in primary hepatocellular carcinoma and their clinical significance[J]. Zhonghua Bing Li Xue Za Zhi, 2003, 32(1): 20-4. doi: 10.3760/j.issn:0529-5807.2003.01.005
[14] Khandakar B, Mathur SR, Kumar L, et al. Tissue biomarkers in prognostication of serous ovarian cancer following neoadjuvant chemotherapy[J]. Biomed Res Int, 2014, 2014: 401245. https://www.researchgate.net/publication/262683881_Tissue_Biomarkers_in_Prognostication_of_Serous_Ovarian_Cancer_following_Neoadjuvant_Chemotherapy/fulltext/5493e4490cf286fe31269f54/262683881_Tissue_Biomarkers_in_Prognostication_of_Serous_Ovarian_Cancer_following_Neoadjuvant_Chemotherapy.pdf
[15] Wang XZ, Liu Q, Sun JJ, et al. Correlation between p53 and epidermal growth factor receptor expression in breast cancer classification[J]. Genet Mol Res, 2015, 14(2): 4282-90. doi: 10.4238/2015.April.28.10
[16] 张秋琴, 左艳, 徐三荣.胃黏膜肠腺化生中Ki67、p53、HER-2、Bcl-2的表达及其临床意义[J].中国临床研究, 2012, 25(5): 423-5. http://d.old.wanfangdata.com.cn/Periodical/zgckyx201205003 Zhang QQ, Zuo Y, Xu SR. The expressions and clinical significance of Ki67, p53, HER-2 and Bcl-2 in the intestinal metaplasia of the gastric mucous membrane[J]. Zhongguo Lin Chuang Yan Jiu, 2012, 25(5): 423-5. http://d.old.wanfangdata.com.cn/Periodical/zgckyx201205003
[17] Yan J, Liu XL, Han LZ, et al. Relation between Ki-67, ER, PR, Her2/neu, p21, EGFR, and TOP Ⅱ-α expression in invasive ductal breast cancer patients and correlations with prognosis[J]. Asian Pac J Cancer Prev, 2015, 16(2): 823-9. doi: 10.7314/APJCP.2015.16.2.823
-
期刊类型引用(1)
1. 黄普超,原慧洁,张桂芳. 基于数据挖掘技术的肺癌危险度预测模型的构建. 实用预防医学. 2022(11): 1390-1394 . 百度学术
其他类型引用(2)