乳腺癌基因芯片数据分析
- 格式:pdf
- 大小:180.99 KB
- 文档页数:4
基因芯片技术在四大癌症筛查中的应用近年来,癌症已经成为全球最为严重的健康问题之一。
根据统计数据显示,全球每年有超过1700万的人被诊断出患有癌症。
其中包括了肺癌、结肠癌、乳腺癌以及前列腺癌等四大癌症。
这些癌症都是由于基因发生突变所引起的,因此基因芯片技术成为了一个十分重要的筛查手段,它可以帮助医生更加准确地判断患者是否患有癌症,并且可以更早地进行诊断和治疗,从而提高患者的生存率。
肺癌筛查肺癌在所有癌症中的死亡率排名第一,因此对于肺癌的筛查非常重要。
传统的肺癌筛查方法使用的是X射线照片或者CT扫描,这些方法虽然可以发现肺部的结节,但很难判断这些结节是否为恶性。
而基因芯片技术则可以通过检测肺癌相关的基因突变情况来判断病人是否有患肺癌的风险。
当检测到某些基因的突变时,基因芯片就可以判断患者是否有肺癌的可能,从而进行相应的治疗。
结肠癌筛查结肠癌常常被忽视,但实际上也是致命的疾病之一。
早期的结肠癌检测一般是通过肠镜检查和血液检测来进行的。
但这些方法不仅费用高昂,而且对患者而言十分不舒服。
基因芯片技术则可以通过检测肠癌相关的基因突变情况来判断病人是否有患结肠癌的风险。
研究发现,一些基因在结肠癌发生的过程中所扮演的角色非常重要。
因此,检测这些基因的突变情况可以很大程度上提高结肠癌的准确诊断率。
乳腺癌筛查乳腺癌是女性中发病率最高的癌症之一。
传统的乳腺癌筛查方法是通过乳房X线检查或者是超声波检查来实现的。
但这些方法在早期阶段很难发现微小的肿瘤,因此,病人很容易因为乳腺癌被误诊而错失最佳治疗时机。
基因芯片技术则可以通过检测有关乳腺癌的基因突变情况来判断病人是否有患乳腺癌的风险。
检测这些基因的突变情况可以在更早期的阶段判断乳腺癌是否存在,从而可以更早地进行治疗。
前列腺癌筛查前列腺癌是男性常见的癌症,主要表现为尿频、尿急、尿痛等症状。
传统的前列腺癌筛查方法是通过前列腺特异性抗原(PSA)检测来完成的。
但PSA值过高并不是一定表明患有前列腺癌,因此很多病人被误诊。
乳腺癌常见基因检测大盘点,看完你会有自己的判断!近年来,随着基因检测技术的发展,肿瘤的治疗开始进入“精准治疗”的时代,根据癌症基因检测结果,医生能进行更有针对性的治疗。
目前乳腺癌治疗中,用于临床的主要有下几种基因检测产品:21基因检测、50基因检测、70基因检测、28基因检测及BCRA基因检测。
其中,21基因检测、50基因检测、70基因检测、28基因检测都属于多基因检测,用于基因检测的样本是手术切下来的肿瘤组织;主要用于评估早期乳腺术后的复发风险,及评估患者术后接受化疗的获益程度。
而BCRA基因检测属于单基因检测,用于基因检测的样本是手术切下来的肿瘤组织及血液;主要用于评估乳腺癌是否具有遗传性及其对铂类药物和PARP抑制剂的敏感性。
下面我们就挨个来看下这些基因检测分别适用于哪些人群。
0121基因检测乳腺癌21基因检测的对象是ER/PR阳性、HER2阴性、淋巴结阴性的早期乳腺癌患者,通过检测肿瘤组织中21个特异性基因的表达水平,计算出一个复发风险评分(Recurrences core,RS)来评估肿瘤患者的复发风险。
其中“有利”基因的高表达将导致一个较低的RS值,而“不利”基因的高表达将导致一个较高的RS值,RS的范围在0-100之间。
根据复发分数可分为低风险患者(RS<18)、中风险患者(18≤RS≤30)和高风险患者(RS≥31);根据得分情况可以分为以下三种情况:•低风险患者的10年远期复发风险低,化疗获益不显著。
•高风险患者的10年远期复发风险高,化疗获益显著。
•中风险患者的化疗的获益尚不确定。
0250基因检测50基因检测在设计之初用于乳腺癌分型,后发展用于复发风险评估。
主要用于评估绝经后ER/PR阳性,HER2阴性乳腺癌患者在内分泌治疗后的复发风险,但该检测结果不能评估患者在辅助化疗中的获益程度。
该技术通过测量肿瘤组织中与乳腺癌相关的50个基因,计算0-100的复发风险分数:•在无淋巴结转移的患者中:RS≤40 称为低风险、41≤RS≤60 称为中风险、61≤RS称为高风险。
乳腺癌21基因检测乳腺癌 2 1 基因检测乳腺癌21基因检测:是指检测乳腺癌肿瘤组织中21个乳腺相关基因的表达⽔平,并将检测结果通过计算公式量化为复发风险评分( Recurrence Score, RS),通过RS来预测患者远期复发风险以及化疗能否获益,辅助临床医⽣为患者制定系统性辅助治疗⽅案(化疗or单纯内分泌治疗)。
乳腺癌21基因是NCCN、ASCO等权威指南联合推荐的乳腺癌多基因检测项⽬检测意义复发风险评分(RS)- RS<26:1) RS<16:患者复发风险低,不推荐化疗,可进⾏内分泌治疗;2) RS16-25:患者复发风险低,若患者年龄≤50岁,推荐化疗加内分泌治疗;若患者年龄>50岁,不推荐化疗,可进⾏内分泌治疗;- RS26-30:患者复发风险中等,是否化疗,需结合其临床及病理因素;- RS>30:患者复发风险⾼,需进⾏化疗加内分泌治疗。
NCCN乳腺癌临床实践指南强烈建议乳腺癌患者进⾏21基因的检测,相关内容详见指南。
适检⼈群浸润性乳腺癌患者(⾏乳房肿瘤切除术或乳房切除术术后患者)激素受体阳性( ER+/PR+)HER2阴性(HER2-)淋巴结阴性(pN0)pT1、pT2或pT3,肿瘤组织>0.5cm备注:2018.V4 NCCN乳腺癌指南⾥也提及:淋巴结阳性(pN+,1-3个腋窝淋巴结转移)、激素受体阳性(ER+/PR+)、HER2阴性(HER2-)乳腺癌患者,如果RS≥18,复发风险⾼,需化疗+内分泌治疗;RS<18,复发风险低,相关数据显⽰,单纯内分泌治疗效果较好,但⽬前缺乏化疗能否获益的相关数据,关于该类型患者预后和化疗治疗能否获益,需要进⼀步研究证实。
资讯来源1. NCCN Clinical Practice Guidelines in Oncology: breast cancer(Version 4.2018).2. Sparano JA, Gray RJ, Makower DF, et al. Adjuvant Chemotherapy Guided by a 21-Gene Expression Assay in Breast Cancer. N Engl JMed 2018; 379:111-121.。
基因芯片数据处理流程与分析介绍关键词:基因芯片数据处理当人类基因体定序计划的重要里程碑完成之后,生命科学正式迈入了一个后基因体时代,基因芯片(microarray)的出现让研究人员得以宏观的视野来探讨分子机转。
不过分析是相当复杂的学问,正因为基因芯片成千上万的信息使得分析数据量庞大,更需要应用到生物统计与生物信息相关软件的协助。
要取得一完整的数据结果,除了前端的实验设计与操作的无暇外,如何以精确的分析取得可信数据,运筹帷幄于方寸之间,更是画龙点睛的关键。
基因芯片的应用基因芯片可以同时针对生物体内数以千计的基因进行表现量分析,对于科学研究者而言,不论是细胞的生命周期、生化调控路径、蛋白质交互作用关系等等研究,或是药物研发中对于药物作用目标基因的筛选,到临床的疾病诊断预测,都为基因芯片可以发挥功用的范畴。
基因表现图谱抓取了时间点当下所有的动态基因表现情形,将所有的探针所代表的基因与荧光强度转换成基本数据(raw data)后,仿如尚未解密前的达文西密码,隐藏的奥秘由丝丝的线索串联绵延,有待专家抽丝剥茧,如剥洋葱般从外而内层层解析出数千数万数据下的隐晦含义。
要获得有意义的分析结果,恐怕不能如泼墨画般洒脱随兴所致。
从raw data取得后,需要一连贯的分析流程(图一),经过许多统计方法,才能条清理明的将raw data整理出一初步的分析数据,当处理到取得实验组除以对照组的对数值后(Iog2 ratio),大约完成初步的统计工作,可进展到下一步的进阶分析阶段。
Rosetta profile error model calculation2Sqweeze replicated probes^Normalize intensities (exclude flagged ^nd wontroldata) with median scaling"Basic statistic plot and Pearson correlationcoefficient^Combine tech nicar repeatPairwise ratid calculation图一、整体分析流程。
乳腺癌HER2基因FISH检测判读标准乳腺癌是人类最常见的恶性肿瘤之一,其中HER2基因的状态对于乳腺癌的治疗和预后评估具有重要意义。
荧光原位杂交(FISH)是检测HER2基因状态的重要手段之一。
以下是乳腺癌HER2基因FISH检测判读的标准,主要包括探针信号识别、细胞计数规定、比例阈值判定、非整倍体评估、基因拷贝数判定、结果分类解读以及质量控制要求等方面。
一、探针信号识别在进行FISH检测时,首先要正确识别探针信号。
通常,HER2基因和对照基因(如CEP17)会被标记为不同的颜色。
正常情况下,HER2基因和CEP17的信号应为红色和绿色。
每个细胞核内应有2个CEP17信号和2个HER2信号。
二、细胞计数规定对于每个样本,应至少分析20个非重叠的、完整的、清晰可辨的细胞核。
如果细胞核不完整、重叠或信号模糊,则该细胞核不应纳入计数。
三、比例阈值判定HER2基因与CEP17的比例(HER2/CEP17)是判定HER2基因状态的关键指标。
根据FISH检测的结果,可以将HER2基因状态分为以下几类:1. HER2基因扩增:当HER2/CEP17比例大于2.0时,判定为HER2基因扩增。
2. HER2基因无扩增:当HER2/CEP17比例小于或等于2.0且大于1.8时,判定为HER2基因无扩增。
3. HER2基因不确定:当HER2/CEP17比例小于或等于1.8时,判定为HER2基因状态不确定,需要进一步检测或结合其他检测方法。
四、非整倍体评估在非整倍体细胞中,CEP17信号可能会超过2个或少于2个。
如果样本中存在非整倍体细胞,应将这些细胞排除在计数之外。
五、基因拷贝数判定除了比例阈值外,还可以根据HER2基因和CEP17的拷贝数来判定HER2基因状态。
通常认为,当HER2基因拷贝数大于6时,为HER2基因扩增。
六、结果分类解读根据以上判读标准,可以将FISH检测结果分为以下几类:1. HER2阳性:当HER2基因扩增或基因拷贝数大于6时,判定为HER2阳性。
乳腺癌患者生存率与分子分型乳腺癌是女性最常见的恶性肿瘤之一,其发生率在不断上升。
乳腺癌的治疗是一个复杂的过程,包括手术、放疗、化疗、内分泌治疗等。
治疗效果的评判是乳腺癌治疗的关键之一。
其中,乳腺癌患者的生存率是评价治疗效果的重要指标之一。
但是,乳腺癌患者的生存率受到多种因素的影响,其中分子分型是一个重要的因素。
分子分型是指根据乳腺癌分子分析的结果,将乳腺癌分为几种不同的亚型。
现有的分子分析方法主要包括基因芯片、转录组测序等。
在乳腺癌中,最常用的分子分型方法是根据ER(雌激素受体)、PR(孕激素受体)和HER2(人类表皮生长因子受体2)状态将乳腺癌分为四类:ER+/PR+/HER2-(luminal A)、ER+/PR+/HER2+(luminal B)、ER-/PR-/HER2+(HER2过表达型)、三阴性乳腺癌(TNBC)。
随着对分子分型的研究深入和分子分析技术的不断进步,我们发现不同分子分型的患者的生存率存在显著差异。
以近年来的研究为例,一项关于中国乳腺癌患者生存率的调查发现,三阴性乳腺癌的患者相对于其他亚型的患者,其病死率更高,生存期更短,而luminal A亚型患者则具有最好的生存率;Lu W. 等人对乳腺癌的分子分型与治疗结果进行了分析,结果表明,HER2过表达型和TNBC患者的局部复发率更高,远处转移率更快,生存率更低;Joanne E. et al. 的一项研究发现,ER+/HER2-乳腺癌与ER+/HER2+乳腺癌对内分泌治疗的反应不同。
以上研究结果表明,不同分子分型的乳腺癌患者其生存率和治疗结果存在显著差异。
而这种差异主要源于各亚型的生物学特性不同。
例如,HER2过表达型和TNBC乳腺癌细胞的增殖速度快,易产生远处转移;而luminal A亚型乳腺癌则对内分泌治疗敏感,生长缓慢。
因此,根据患者的分子分型制定个性化的治疗方案十分必要。
个性化治疗是将患者的病理学特征、分子生物学标志等个体差异因素纳入治疗的考虑范畴,根据患者的分子分型和特点制定具有针对性的治疗方案,以提高治疗效果。
乳腺癌细胞株的基因表达谱基因表达谱是指在特定条件下,一个细胞或组织中所有基因的表达水平。
乳腺癌是一种复杂的疾病,其发生和发展涉及多个基因的异常表达。
通过研究乳腺癌细胞株的基因表达谱,我们可以深入了解乳腺癌的生物学特性,为诊断、治疗和预防乳腺癌提供重要的信息。
近年来,随着高通量测序技术的发展,越来越多的乳腺癌细胞株的基因表达谱被揭示出来。
这些数据为研究乳腺癌的分子机制提供了宝贵的资源。
在本文中,我们将综述一些乳腺癌细胞株的基因表达谱研究进展,并探讨其对乳腺癌诊断和治疗的影响。
一、MCF7细胞株MCF7细胞株是最常用的乳腺癌细胞株之一,它来源于人乳腺癌组织。
研究发现,MCF7细胞株的基因表达谱具有较高的异质性,其中包括多种信号通路和基因表达的异常。
例如,PI3K/AKT信号通路在MCF7细胞株中过活化,导致细胞增殖、存活和迁移能力的增强。
MCF7细胞株中还表达了多种激素受体,如雌激素受体(ER)和孕激素受体(PR),使得它们对激素治疗具有敏感性。
二、MDAMB231细胞株MDAMB231细胞株是另一种广泛使用的乳腺癌细胞株,来源于人乳腺癌组织。
与MCF7细胞株相比,MDAMB231细胞株具有更强的转移和侵袭能力。
研究发现,MDAMB231细胞株的基因表达谱中,多种与转移和侵袭相关的基因表达异常,如matrix metalloproteinases (MMPs)和clusterin等。
MDAMB231细胞株中ER和PR阴性,使得它们对激素治疗具有抵抗性。
三、T47D细胞株T47D细胞株是另一种人乳腺癌细胞株,来源于乳腺癌组织。
T47D细胞株的基因表达谱具有独特的特征,如高表达ofertheclinicalresponse (OCR)和低表达breastcancerassociated gene 1 (BCAS1)。
研究发现,OCR的高表达与T47D细胞株对化疗药物的敏感性有关,而BCAS1的低表达则与细胞存活和增殖能力的降低有关。
复里亏提(医学版) Fudan Univ J Med sci 169
乳腺癌基因芯片数据分析 蒋定锋 高 峻 赵耐青 (复旦大学公共卫生学院卫生统计与社会医学教研室 上海200032)
【摘要】 目的以乳腺癌病人的表达谱芯片数据为基础,探寻乳腺癌复发的相关基因。方法对标化芯片数据 进行缺失值处理后,分别用单因素COX回归模型和综合了聚类及多因素COX回归的综合法来筛选兴趣基因, 然后通过兴趣基因对病人做样品聚类,以灵敏度、特异度、约登指数和Kaplan.Meier法评价分类效果,最后结合 文献和蛋白质数据库探寻乳腺癌复发的相关基因。结果综合法筛出的3O个P<0,01的基因对乳腺癌病人复 发状况的预测效果最佳;单因素COX回归筛出的102个P<0,01的基因的预测效果较差;单因素C0X回归筛 出的15个P<0.001的基因预测效果最差。结论综合法筛选得到的3O个基因可用来评价病人的预后状况, 为进一步的生物学研究提供待选基因。 【关键词】乳腺癌; 基因芯片; 聚类分析; COX回归模型 【中国图书馆分类法分类号】R 737.9,0 212,1
Microarray Data Analysis for Breast Cancer JIANG Ding—feng,GAO Jun,ZHAO Nai—qing (Department ofHealth Statistics and Social Medicine,Sdmol ofPublic Health,Fudan University Shanghai 200032,Ckina) 【Abstract】Purpose To study the relapse-related genes based on gene expression profiles from breast can. cer patients with different clinical outcomes.Methods Firstly,univariate COX regression model was used to analysis the microarray data tO select the potential genes.Secondly,an integrated method composed of cluster and multivariate O0X analysis was also carried out,Then K—means cluster method was applied tO clas— sify the relapse situation of patients.Sensitivity,specificity,Youden’S index and Kaplan・Meier analysis were used tO evaluate the genes selected by different methods, Results The 30 genes(P<0.01)selected by the integrated method performed best when predicting the relapse situation of patients,The 102 genes(P<0. 01)by univariate COX analysis performed well while the 15 genes(P<0.001)by univariate COX analysis performed worst, Conclusions The 30 genes selected by the integrated method,especially the genes which were also picked out by the other two methods,are worthy of further experiments to a&ses8 the resultS of microarray. 【Key words】breast cancer;microarray;cluster analysis;COx regression model
乳腺癌是西方女性的高发肿瘤。在我国发病率 也逐年升高,尤其在京、津、沪等沿海发达地区,其中 以上海最高,1997年发病率为49/10万,居女性恶 性肿瘤的首位…。 目前具有相同症状及病理类型的患者经过相同 治疗后,在预后上存在极大差别。这说明当前乳腺 癌的分类标准有待提高,同时提示病人内在的基因 表达对病人的预后具有重要意义。基因芯片能同时 检测数千个基因的表达,了解病人特异的表达谱,为 通讯作者E mail:nqzhao@shmu edu cn 系统研究乳腺癌预后的相关基因提供了技术保证, 从而成为乳腺癌研究领域的一种常规技术。 如何对芯片产生的海量数据进行分析,以获得 有效的生物学信息来指导后续研究是乳腺癌研究的 重点和难点。我们利用Christos等 j提供的数据, 综合运用聚类和COX回归模型两种方法来筛选乳 腺癌复发的相关基因。为了克服多重比较导致假阳 性增大的危险,本研究对P值进行了控制。该芯片 数据包括99个病人的乳腺癌样品的7650个探针,
维普资讯 http://www.cqvip.com 170 复旦学报(医学版)2005年3月,32(2) 其数据矩阵为99×7 650,并且已知99个病人的其 他信息如复发与否、复发时间和失访时间等。 材料和方法 缺失值的处理 对缺失少于1/3的标化探针数 据(即至少有66个病人有该探针数据)共7 475个 探针进行缺失值处理。7 475个探针中4 404个无 任何缺失,而其他3 071个则有不同程度的缺失。 将3 071个探针分别作为应变量,4 404个探针为待 选自变量,利用SAS软件用多元逐步回归法填充缺 失值,采用前进法,人选标准a=0.001,控制模型变 量个数。 单因素COX回归分析 对7 475个探针进行 单因素COX回归分析,乳腺癌复发定义为失效事 件,结果有15个探针的P<0.001,将对数风险函数 的预测值定义为Y1 =Z (i=1,2…15);同时有 102个探针的P<0.01,将对数风险函数的预测值 定义Y2,=Z (j-=1,2…102)。 综合法分析 用单因素COX回归分析对7 475 个探针进行初筛,乳腺癌复发定义为失效事件,人选 标准a=0.1,共有816个探针入选。对816个探针 用层次聚类法聚类,组间连接法,Pearson相关系数 为指标,聚成2O类。然后用多因素COX回归模型 对每一类来筛选兴趣探针,采用逐步回归法,人选标 准P=0.01,移出标准P=0.011。结果20类中有 7类无一个探针符合人选标准,其余13类中共有30 个探针符合标准。将30个探针所在13个类的对数 风险函数预测值定义为Y3女= (k=1,2…13)。 K.Means聚类 分别以单因素COX回归分析 得到的线性预测值y1 (i=1,2…15)、y2,(j_= 1,2…102)和综合法得到的线性预测值 (是=1, 2…13)为应变量,用K.Means聚类法对99个病人 进行聚类,分成2类。 效果评价对3个聚类结果分别与病人的实际 复发状况比较,计算灵敏度、特异度和约登指数,然 后以预测分类结果为分组变量;用Kaplan—Meier法 对病人的复发时间作生存分析,评价不同方法得到 的15、102和30个兴趣探针的分类效果,结合文献 报道探寻乳腺癌复发的相关基因。 结 果 以Yl 、Y2j和y3女为指标做样品聚类后,分类 和实际复发情况见表1~3。 由表1~3可见以 3女为指标作分类,其预测效 果最佳、 2,次之,y1 最差。
表1 Y1 为指标聚类后结果 Tab 1 Cluster results by Yli Thepredi c tedstatusofthepa tients
The real status of patients Not relapse: Relapse:,S ̄rn r1l1 tPr 1 r11 lstPr 2
Not rdapse:0 Relapse:1 Sensitivity(95%confidence interva1) Specificity(95%confidence interva1) Youden’Sindex 43 11 54 19 26 45 62 37 99 26/45=0 578(0 422—0 723) 43/54:0 796(0.665—0 894) 0 578+0 796—1=0 374
Note:Cluster results of 15 probes through univariate COX analysis(P< 0 001)
表2 Y2 为指标聚类后结果 Tab 2 Cluster results by Y2] The predi c tedstatusofthepatients
The real status ofpatients Not relapse: Relapse:,S ̄rn duster1 cluster 2
NOt rdapae:0 Relapse:1 Sum Sensitivity(95%confidence interva1) Specificity(95%confidence interva1) YoudeFl’S indeX 38 16 54 6 39 45 44 55 99 39 5=0 867(0 732—0 949) 38/54=0 704(0 564—0 820) 0 867+0 704—1=0 571 Note:Cluster results of 102 probes through univariate COX analysis(P< 0.01)
表3 Y 为指标聚类后结果 Tab 3 Cluster results by Yak The p r ed ictedstatusof th epatients
The real Sta ̄S ofpatients Not rdapae: Relapse:,S ̄rn cluster 1 cluster 2
NOt relapse:0 Relapse:1 Sum Sensitivity(95%confidence intercat) Spec f citv(95%confidence interva1) Youden’S index 46 8 54 6 39 45 52 47 99 39/45=0 867(0 732—0 949) 46, 4=0 852(0 729—0 934) 0 867I}0 852—1=0 719