MeDIP- Seq(Methylated DNA Immunoprecipitation Sequencing )采用甲基化DNA免疫共沉淀技术。
通过5'-甲基胞嘧啶抗体特异性富集基因组上发生甲基化的DNA片段并进行高通量测序。研究者通过MeDIP Sequencing可以快速有效地寻找基因组上的甲基化区域,从而比较不同样本间DNA甲基化修饰模式的差异。
此方法可以覆盖整个基因组范围的甲基化区 域并且成本较低,特别适用于多样品的全基因组DNA表观遗传研究。
数据分析流程
数据分析内容
对MeDIP-seq测序数据进行分析,包括数据预处理、基因组比对、比对结果相关统计、对于CpG岛区域、启动子区域及整个基因组的覆盖和深度、甲基 化富集peak 查找、单样本peak区域在基因组不同功能区域和CpG岛区域的分布统计多样本差异甲基化区段(DMR)筛选、差异甲基化区段在CpG岛和CpG岛岸的 分布统计、差异甲基化区段在启动子和不同基因功能区的分布统计、相关注释和富集分析(基因、CpG岛、GO和KEGG等)。
测序数据质量控制
包括:总reads数、总base数,Q20比例、Q20位点分布图。
测序数据预处理
包括:去除总体质量偏低的reads,将质量大于20碱基所占比例小于50%的reads去除;去除3’端质量Q低于20的碱基;去除reads中所含有的接头序列;去除长度小于20的测序片段(reads)。
将预处理后的reads比对到参考基因组并统计富集效率
包括:Reads唯一比对率,在CpG岛区域、启动子区域及整个基因组的覆盖及不同深度关系。
Peak查找和统计
应用MACS软件对基因组mapping得到的bam文件进行peak 富集区查找,并统计长度和染色体分布。
Peak在CpG岛、不同基因功能元件和不同GC含量区域中的分布
Peak CpG岛分布:
Peak不同基因功能元件上的分布:
基于peak的样本间差异分析
将各样本有重叠的peak合并,统计每个样本在合并后的peak中是否富集,统计组间差异的个数并基于RPKM (Reads Per Kilobase per Million mapped reads)计算peak在组间差异是否显著。
差异是否显样本间差异peak区域测序深度作图
对差异基因进行GO功能富集分析及pathway功能分析
GO功能分析:
KEGG功能分析:
MeDIP-seq数据和表达谱数据结合分析
将MeDIP-seq数据和表达谱数据结合分析,对富集peak区域和差异表达基因进行关联。
全基因组甲基化图谱
引用地址
http://blog.sciencenet.cn/blog-1271266-857855.html
联系客服