以PacBio公司的SMRT单分子实时测序技术(Single molecule real-time
sequencing)为代表的三代测序技术,通过其独有的环形一致性测序模式(Circular-consensus
sequence,CCS),极大提高了单碱基测序的准确率,远超Illumina等二代测序技术。与传统转录组测序项目相比,利用PacBio平台的全长转录组测序技术可以直接获得mRNA的全长,保证了mRNA序列的精确性。上期我们为大家介绍了全长转录组测序的数据质控,本期将为大家介绍三代全长有参转录组的分析内容。主要包括:
1. 转录本分类
数据过滤后得到高质量的Reads of Insert(RoI),接着对其进行转录本分类。理论上完整的RoI应该有5’primer、3’primer和polyA部分。但在实际测序中,由于5’端降解等因素,并不是所有的RoI都是完整的,即不是全长转录本序列,而且有少部分RoI序列为嵌合体。因此通过检测RoI序列是否含有 5’primer, 3’primer和polyA以及其位置的关系, 将RoI序列分为全长非嵌合(Full-Length-Non-Chimeric)序列、全长嵌合(Full-Length-Chimeric)序列、非全长(Non-Full-Length)序列等。其中全长非嵌合序列即是物种原始的全长mRNA序列,各分类之间的相互关系见下图:

2.
1.
数据过滤后得到高质量的Reads of Insert(RoI),接着对其进行转录本分类。理论上完整的RoI应该有5’primer、3’primer和polyA部分。但在实际测序中,由于5’端降解等因素,并不是所有的RoI都是完整的,即不是全长转录本序列,而且有少部分RoI序列为嵌合体。因此通过检测RoI序列是否含有 5’primer, 3’primer和polyA以及其位置的关系, 将RoI序列分为全长非嵌合(Full-Length-Non-Chimeric)序列、全长嵌合(Full-Length-Chimeric)序列、非全长(Non-Full-Length)序列等。其中全长非嵌合序列即是物种原始的全长mRNA序列,各分类之间的相互关系见下图:

2.





