传统RNA-seq定量分析过程中,由于建库过程中PCR对片段长度和GC碱基含量的偏好 会导致部分文库片段丰度失真,进而对定量结果产生影响。UMI(Unique Molecular Identifier)分子标记则通过随机性利用不同的分子标签,标记和区分 不同的分子。绝对定量转录组测序(UMI-seq)通过在文库扩增前为每一条逆转录的cDNA添加唯一的分子标签UMI,使同一个片段扩增出来的产物均带有相同的标签,天然重复片段则带有不同的标签。利用UMI过滤数据,可一比一准确还原样本初始状态。
被唯一的随机分子标签标记的cDNA分子,在PCR、测序及后续分析过程中都携带着这个 独特的UMI标签。通过计数UMI的个数,可实现原始RNA分子的“绝对定量”。
我们采用主流的层次聚类对基因表达值进行聚类分析,对表达数据的行进行均一化处理。热图中表达模式相近的基因或样本会被聚集在一起,每个方格中的颜色反映的不是基因表达值,而是表达数据的行进行均一化处理后得到的数值,所以热图中的颜色只能横向比较(同一基因在不同样本中的表达情况),而不能纵向比较(同一样本不同基因的表达情况)。横向比较时,红色表示基因高表达,蓝色表示基因低表达。结果文件中既有组间的聚类,也有样品间的聚类。结题报告展示的是样品间的聚类,具体如下图所示。图中横坐标为样品名,纵坐标为差异基因FPKM归一化后的数值。
从GO富集分析结果中,选取最显著的30个Term绘制散点图进行展示,若不足30个,则绘制所有Term,如下图所示。图中横坐标为注释到GO Term上的差异基因数与差异基因总数的比值,纵坐标为GO Term,点的大小代表注释到GO Term上的基因数,颜色从红到紫代表富集的显著性大小。
从KEGG富集结果中,选取最显著的20个KEGG通路绘制散点图进行展示,若不足20个,则绘制所有通路,如下图所示。图中横坐标为注释到KEGG通路上的差异基因数与差异基因总数的比值,纵坐标为KEGG通路,点的大小代表注释到KEGG通路上的基因数,颜色从红到紫代表富集的显著性大小。
可变剪接是调节基因表达和产生蛋白质组多样性的重要机制,也是RNA-seq的重要分析内容,我们使用rMATS软件进行可变剪接分析,主要包括SE、RI、MXE、A5SS、A3SS五种可变剪接事件,如下图所示:
变异位点分析是RNA-seq结构分析的重要内容,主要包括先天变异位点和后天体细胞突变位点的检测,对肿瘤等研究具有重要意义。我们使用GATK软件对样本数据进行变异位点分析,并用SnpEff软件对变异位点进行注释,其分析流程如下图所示。
点击进行购买咨询
购买咨询© 2023 GENECHEM All RIGHTS RESERVED .