RNA-seq分析:Step5(拼接)

目录

前记

​编辑 一、转录本拼接

二、转录本整合

三、转录本注释信息比较

后记


前记

转录本拼接是指将同一个基因产生的不同转录本进行合并,形成一个完整的基因序列。转录本拼接主要应用于RNA-Seq数据分析中,对基因组注释的完善以及发现未知的基因和转录本具有重要意义。

在进行转录本拼接时,首先需要将原始的RNA-Seq数据进行清洗和过滤,去除低质量的序列和污染物。接着,利用特定的拼接软件对清洗后的序列进行处理,根据同源性、跨越剪切和外显子连接等特征,将不同的转录本进行合并。常用的拼接软件包括Cufflinks、StringTie和Trinity等。

最后,对拼接后的转录本进行基因组注释和生物信息学分析,可以通过比对已知基因序列进行功能注释,或者通过差异表达分析探究基因在不同组织和生理状态中的表达特征。

转录本拼接的方法可以帮助我们全面了解同一基因不同转录本的特征,为研究基因表达调控机制提供更多的信息。

注:如果只关注基因的表达情况,并且不需要鉴定新的转录本,可以跳过此步。

本文以StringTie软件进行转录本的拼接。

 一、转录本拼接

使用stringtie软件进行转录本的拼接。

#对SRR3418005进行转录本拼接
stringtie -p -2 -G tair10.gtf -o SRR3418005.gtf -l SRR3418005 SRR3418005.bam &

二、转录本整合

#整合所有样本的转录本信息
stringtie --merge -p 2 -G tair10.gtf -o stringtie_merged.gtf gtflist.txt
#注:gtflist.txt为每个样本gtf文件的路径,stringtie_merged.gtf是整合之后的gtf文件

三、转录本注释信息比较

#使用gffcompare比较鉴定新的转录本
gffcompare -r tair10.gtf -G -o merged stringtie_merged.gtf & 

后记

转录本拼接和整合的目的是将来自同一基因或同一转录本的多个不同剪切形式的转录本序列组合成一个完整的转录本,并进行相应的注释和分析。这样可以更准确地描述基因的结构和表达情况,为后续的基因功能研究提供更可靠的基础数据。同时,转录本拼接和整合还可以提高对转录组数据的解读能力,发现新的功能小RNA和新的外显子等。

后续讲述如何计算基因的表达量。

2023.8.23

----CXGG


本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!

相关文章

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部