SNP(Single Nucleotide Polymorphisms),是指在基因组上单个核苷酸的变异,包括转换、颠换、缺失和插入,形成的遗传标记,其数量很多,多态性丰富,是人类可遗传的变异中最常见的一种。从理论上来看每一个SNP位点都可以有4种不同的变异形式,但实际上发生的只有两种,即转换和颠换,二者之比为2:1。SNP在CG序列上出现最为频繁,而且多是C转换为T,原因是CG中的胞嘧啶常被甲基化,而后自发地脱氨成为胸腺嘧啶。
一般而言,SNP是指变异频率大于1%的单核苷酸变异。在人类基因组中大概每1000个碱基就有一个SNP,人类基因组上的SNP总量大概是3×10^6个。因此,SNP成为第三代遗传标志,人体许多表型差异、对药物或疾病的易感性等等都可能与SNP有关。
SNP根据其在基因中的位置,可以分为基因编码区、基因非编码区、基因间隔区(基因之间的区域)。由于基因序列的兼并性,编码序列中的SNP不一定会改变蛋白的氨基酸序列。编码区的SNP有两种类型:同义和非同义。同义单核苷酸多态性并不影响蛋白质序列,而非同义的则会改变蛋白质的氨基酸序列。
而不在蛋白质编码区的SNP仍可能影响基因剪接、转录子结合、信使RNA降解或非编码区的RNA序列。受到这种单核苷酸多态性(SNP)影响的基因表达被称为单核苷酸多态性表达(ESNP),可能发生在此基因的上游或下游。
1998年,首次开始绘制SNPs图谱,至今已获得超过500万个SNP位点信息,并形成了NCBI、TSC以及JSNP等数据库。
基质辅助激光解吸电离飞行时间质谱(Matrix Assisted Laser Desorption Ionization Time of Flight Mass Spectrometry,MALDI-TOF MS)技术的SNP分型原理是:PCR扩增目标序列,加入SNP序列特异延伸引物,在SNP位点上延伸1个碱基。将样品分析物与芯片基质共结晶,经MALDI离子化,离子在加速电场中获得动能,再根据其荷质比不同,在飞行管中的飞行时长不同。离子质量越小,就越快到达。利用质谱分析对质量的灵敏度特别高的特点,很容易将仅含有一个不同碱基的两段基因序列区别开,推导出SNP分型。
SNP质谱的优势
- 低成本,直接通过分子量(荷质比)测定,无须荧光标记、凝胶电泳
- 高灵敏度,最低可达fmol
- 高准确性,质谱级的测试技术
- 高通量,一次可测试384个样品,每孔最多可达40重反应
- 快速,几秒就能完成一个反应孔的检测
- 操作简单,流程最简化,除质谱外,只须PCR等常规设备辅助
- 操作步骤少,反应环境单一,降低污染可能
应用领域:
疾病筛查
疾病预测
基因位点研究
农业育种
公安刑侦