测序饱和度表示的是测序量与检测到的表达基因数量之间的关系,当测序量达到一定标准时,检测到的表达基因数量就逐渐趋近饱和。
cDNA片段随机性检验是通过比对到参考基因序列上的reads数量来进行评估的。由于不同的参考基因有不同的长度,因此对不同长度的参考基因做了均一化处理。reads在基因上分布均匀就标明cDNA片段的随机性好。
根据样品不同表达量对应的密度值做密度分布图。
基因表达量的计算使用RPKM法(Reads Per Kb per Million reads){Mortazavi, 2008 #103},其计算公式为:
设RPKM(A)为基因A的表达量,则C为唯一比对到基因A的reads数,N为唯一比对到基因组的总reads数,L为基因A编码区的碱基数。RPKM法能消除基因长度和测序量差异对计算基因表达的影响,计算得到的基因表达量可直接用于比较不同样品间的基因表达差异。
结果示例
Gene_ID | Length | RPKM | Count |
---|---|---|---|
ENSSSCG00000000001 | 1551 | 0.381569 | 3 |
ENSSSCG00000000002 | 2157 | 40.5386 | 462 |
ENSSSCG00000000003 | 1410 | 6.25005 | 44 |
基因的ID | 基因的有效长度 | RPKM值 | 比对到基因上的reads数 |
联系客服