MSI
in 生物信息肿瘤学科基因科技 with 0 comment

MSI

in 生物信息肿瘤学科基因科技 with 0 comment

MSI

微卫星不稳定(MSI),是由于错配修复(MMR)基因突变导致错配修复蛋白表达缺失而引起的,自1993年Altonen等首次在遗传性非息肉病性结直肠癌(HNPCC)中发现存在高频MSI(MSI-H)后,人们发现 MSI 在结直肠癌中不仅具有诊断价值,更可以指导治疗, NCCN 指南已将 MSI 列为结直肠癌患者预后以及辅助化疗疗效的预测指标。
MSI分为高不稳定(MSI-H)、低不稳定(MSI-L)和稳定(MS-S)
对于不同肿瘤,其存在 dMMR/MSI-H 的比率是不同的,具体比例如下图所示:

0028BTAYzy7rWZyRRYK62.jpeg

MMR

当肿瘤细胞中存在 MMR 基因功能缺失(Mis-Match Repair deficiency,简称 dMMR)时,标志肿瘤细胞失去对DNA 复制错误的修复能力,肿瘤细胞内将积累大量突变,就会伴随出现微卫星不稳定性(MSI)特征。
所以通过肿瘤微卫星不稳定性(MSI)检测区分出 MSI-H 实体瘤患者,具有重大临床意义。

0028BTAYzy7rWZA40qre7.jpeg

1、MSI介绍

微卫星是真核生物基因组中均匀分布的、短串联重复序列或简单重复序列,一般由1~6个核苷酸的串联重复单元构成,重复5至50次不等,其重复次数在个体间呈高度变异。在DNA的复制过程中,DNA聚合酶在遇到串联重复序列时会发生“打滑”,引起微卫星位点中核苷酸的插入或缺失。而这一过程可以被错配修复(mismatch repair,MMR)系统所识别并修复,若MMR基因发生启动子区的高甲基化或编码区的突变,导致其功能丧失,则会无法及时修复微卫星中自发的高频长度变异,从而引起MSI。人类基因组中有数以万计的微卫星位点, 这些微卫星位点近似均匀地分布在各个染色体上, 所有的微卫星序列约占整个基因组的3%. 
目前已有大量证据表明,dMMR/MSI-H是II期CRC患者预后良好的一个标志物。因此,对于具有dMMR/MSI-H肿瘤的II期CRC患者,3/4级分化(低分化)不再认为是高危因素。但是,期的结直肠癌与/期相比,MSI-H患者的病理类型更差,生存结局也更差。这些研究也支持了在dMMR进展期结直肠癌患者的无进展生存(PFS)和OS结局更不尽如人意的研究结果,有研究显示,dMMR可作为5-FU辅助治疗CRC无效的预测标志物。
2017年5月FDA 批准了Pembrolizumab用于任何 “MSI-H/dMMR亚型” 的实体瘤。
2017年8月FDA 又批准 nivolumab 用于既往接受氟尿嘧啶、奥沙利铂、伊立替康治疗后病情进展且携带微卫星不稳定性高(MSI-H)或错配修复缺陷(dMMR)的转移性结直肠癌(mCRC)成人及12岁及以上儿科患者的治疗。

WX20190730-092956.png

可以归纳为:

现象:即测序数据中表现出的微卫星位点重复单元重复次数的波动,;
本质:碱基的插入与删除;
机制: 即DNA错配修复系统相关基因启动子超甲基化或发生突变使得这些基因无法表达, 进而影响到错配修复系统的功能.;

2、检测方法

1. 免疫组化法(IHC)

MSI 常由MMR基因突变及功能缺失导致,因此可以通过免疫组化检测肿瘤组织中MMR蛋白缺失来间接确定MSI的状态。IHC主要是检测MMR蛋白(MLH1、MSH2、MSH6和PMS2)表达情况,蛋白正常表达为MSI-L/MSS,只要有任一个蛋白功能缺失,即为MSI-H,见表1。
免疫组化检测的优势是可以直接鉴定出导致 MSI 发生的 MMR 缺陷基因,但是,约5%-11%的MSI发生并不会出现 MMR 蛋白的缺陷。另外某些 MMR 蛋白错义突变,MMR 功能损失却保留其抗原性,免疫组化检查出现假阳性,而多重荧光 PCR-MSI 检测正好可以弥补。

2.MMR基因直接测序

对 MMR 基因各区域(MLH1、MSH2、MSH6等)的扩增产物直接测序,该方法可以得到 MMR 基因突变的直接证据,但是不能提供基因功能异常的证据,并且不能检测出基因启动子的甲基化情况,而甲基化是高频微卫星不稳定状态的常见原因。

3.多重荧光PCR

通过对肿瘤组织和正常组织中选定的微卫星位点进行PCR扩增及凝胶电泳, 通过比较两组电泳结果的差异来确定MSI的状态. 然而人类基因组中有数以万计的微卫星位点, 不同的位点对于检测MSI的敏感性和准确性也各不相同。多重PCR 是 MSI 检测的金标准,可重复性强,是对肿瘤组织 MSI 状态的直接反应。但是 PCR 检测结果不能显示4种修复蛋白中哪种蛋白功能缺陷,因此它不能区分与 MSI 有关的结直肠癌是散发性或是 Lynch Syndrome。
实验方法的局限性:
首先, 需要耗费一定的时间和人力;
其次, 结果的准确性依赖于分析人员的肉眼判断;
再者, 微卫星标记和MMR蛋白都有其局限性.
对于微卫星标记, 实验中选择的数量有限, 存在组织(肿瘤)特异性, 无法准确地在多种肿瘤中检测MSI状态;
对于MMR蛋白, 由于MMR可能不是引起MSI的唯一原因, 以及MMR自身的复杂性, 使用MMR蛋白的表达来间接判断MSI状态也存在局限性。
计算方法的优势:
利用测序数据, 可以对样本的MSI状态作出全面的评估. 相比于生物学实验方法, 计算方法的众多优势使其可能在未来用于微卫星不稳定的临床检测. 在这个过程中, 还需要考虑以下方面的问题. 首先, 数据支持. 不论是基于一般统计模型的方法还是基于机器学习模型的方法, 要确定合适的阈值或提高分类器的准确性都需要大量数据的支持. 其次, 软件易用性. 软件要易于安装, 其使用应该在最大程度上实现自动化同时运行时间需要在可接受的范围内.

3、常用工具 来源

方法分类:

【1】模型

从模型的角度可以将这些方法分为基于一般统计模型的方法和基于机器学习模型的方法。
(1)基于统计的方法, 首先选取一个可以反映微卫星不稳定特点的指标, 然后在一组给定的样本上(MSI的临床检测结果已知), 确定该指标与临床检测结果的一致性及分类阈值。
(2)基于机器学习的方法, 主要通过特征提取、特征选择及分类器训练的方法进行MSI状态的预测。

【2】样本:

从样本的角度可以将这些方法分为基于配对的肿瘤-正常样本的方法和仅基于肿瘤样本的方法。
方法介绍
【a】基于一般统计模型的MSI检测方法
(1)基于Indel的MSI检测方法
MSI中发生的重复单元的插入与删除从本质上是小片段碱基的插入与删除, 即Indel. Lu等人正是从这个角度出发, 将MSI的判定问题转化为了微卫星区域的Indel变化问题.
对于每个样本, 首先进行Indel识别, 其次对获得的Indel进行过滤并保留位于微卫星区域的Indel. 通过在一组样本(MSI临床检测结果已知)上对PI、PD以及PI/PD作为MSI判别指标进行t检验评估(其中PI表示微卫星区域insertion占所有insertion的比例, PD表示微卫星区域deletion占所有deletion的比例, PI/PD为二者的比率), 选择了PI/PD作为样本的MSI判别指标. MSI-H的样本在该指标上的取值显著低于MSS的样本.

(2)mSINGS
mSINGS首先判断每个微卫星位点的稳定性, 进一步根据不稳定的微卫星位点的比例来判断样本的MSI状态. 对于每个微卫星位点, mSINGS试图找到一个指标来量化其稳定程度, 并基于一组MSS样本建立各微卫星位点该指标的参考值, 对于给定样本的某个微卫星位点, 若该指标取值超出参考范围, 则认为该微卫星位点不稳定. 通过这种方式, mSINGS解决了仅有肿瘤样本情况下MSI的判定问题。该方法是使用的统计学的方法来判断,但关键问题是样本的选取,包括样本的个数,癌种等。

(3) MSIsensor(推荐使用)
与mSINGS相似, MSIsensor也是通过分别判断每个微卫星位点的稳定性, 然后以不稳定微卫星位点的比例作为MSI得分. 不同的是,  MSIsensor需要基于配对的肿瘤-正常样本进行MSI的判定. 首先, 对于在肿瘤和正常样本中测序深度均大于等于20的微卫星位点, 计算其等位基因的分布信息; 其次, 通过卡方检验比较肿瘤和正常样本的相同微卫星位点的等位基因分布, 若显著不同, 则认为该微卫星位点不稳定; 最后统计不稳定位点的比例, 若该比例超过阈值, 则判定为MSI-H, 其中, 阈值是通过该指标在一组样本上(包括MSI-H和MSS的样本)的累积分布确定的,此软件目前来看相对校准。

(4)MANTIS
类似于MSIsensor, MANTIS也获得了肿瘤-正常配对样本在每个微卫星位点的等位基因分布信息; 与MSIsensor不同的是, 对于每个微卫星位点, MANTIS把上述两组数据看作两个向量, 定义这两个向量的 L1范数为样本中该位点的稳定程度, 对所有位点的L1范数求平均值即为样本的MSI得分。
【b】基于机器学习模型的MSI检测方法

(1)MSIseq
发生微卫星不稳定的样本其单核苷酸替代(Single Nucleotide Substitution, SNS)率以及小片段碱基的插入与删除(Indel)比率都会发生变化, MSIseq主要是从基因变异这一角度出发选取特征的。 MSIseq使用五折交叉验证分别基于LR、决策树、随机森林、朴素贝叶斯算法训练了分类器并评估了性能, 最终选择基于决策树算法的分类器, 该分类器仅使用了S.ind这一个特征.

(2)MOSAIC
MOSAIC是基于对每个微卫星位点稳定性的判断设计特征的. 除了与各微卫星位点稳定性相关的特征外, 还增加了通过在一组样本上对所有微卫星位点的稳定性进行分析后发现的显著不稳定的微卫星位点信
MOSAIC分别基于决策树和随机森林算法训练了模型, 最终选择了基于决策树算法的分类器, 该分类器仅使用了peak_avg以及defsite两个特征 .

【c】EDB-MSI新算法检测肿瘤MSI状态具有更高准确性

EDB-MSI算法是基于NGS的新型微卫星不稳定性检测的算法。它是基于MSI文献积累的历史致病位点,选取目标区域上与癌症相关的13个MS位点,代号为MSI1-MSI13。通过统计待检测样本和与之配对的对照样本在上述13个MS位点处重复单位的长度的分布情况,得到每个位点的MSI风险评分。最后,通过综合考虑13个目标MS位点的得分情况来给出待检测样本的整体MSI状态。
研究结果显示,基于EDB-MSI方法所得结果与金标准MSI-PCR结果有较高的一致性,且可避免人为干扰因素导致的结果不准确性。EDB-MSI方法与其它的MSI-NGS方法进行比较,如MANTIS,MSISensor,mSINGS,MSI_baseline等,结果表明,EDB-MSI方法的准确性最高。EDB-MSI算法对分析结直肠癌患者的MSI状态有潜在的效用,后续可考虑将该算法应用于癌症样本的MSI状态分析。

WX20190730-093031.png

回复