打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
RNA-Seq数据用aspera高效批量下载(万事开头难)

学完了生信技能树的转录组课程,是时候实战一波了,我选择的是 NCBI数据集是SRP033333

  • Description KPC (Comparing mutant-p53 expressing cells to knockdown cells) Total Samples 6

下载数据

由于是EBI数据库,用wget下载速度太慢,Jimmy大神强烈建议用aspera工具下载,于是参考生信技能树教程代码,首先需要熟悉GEO和SRA数据库:

然后参考:使用ebi数据库直接下载fastq测序数据  , 需要自行配置好,然后去EBI里面搜索到的 fq.txt 路径文件。使用conda安装aspera

conda create -n download conda activate download conda install -y -c hcc aspera-cliconda install -y -c bioconda sra-toolswhich ascp ## 一定要搞清楚你的软件被conda安装在哪ls -lh ~/miniconda3/etc/asperaweb_id_dsa.openssh

我用EBI主页搜索SRR号搜索到项目链接,下载fastq或sra数据,这里就直接下载fq数据。

单个样本fq下载

找到单个样本的链接很容易:

(base) vip31@tpm2-WD12:~/RNA_Seq/sra$ ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR103/003/SRR1039773/SRR1039773_1.fastq.gz ~/RNA_Seq/sra/

批量下载(需先获得fq数据地址列表)

需要进行如下操作:

这样就拿到了如下所示的全部下载链接,可以使用循环进行批量下载啦:

  • 批量循环代码,需要注意格式,具体参考代码

cat filereport_read_run_PRJNA229893_tsv.txt | while read id; do ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@$id ~/RNA_Seq/sra/; done

  • 数据较多等待时间比较长,可以nohup后台下载,方法总比困难多

nohup cat filereport_read_run_PRJNA229893_tsv.txt | while read id; do ascp -QT -l 300m -P33001 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@$id ~/RNA_Seq/sra/; done &

数据下载完成

 

万里长征第一步终于搞定,看教程很容易,自己操作困难重重,还好有jimmy老师团队倾心相助。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
超实用干货贴 | 转录组测序原始数据如何上传到NCBI数据库?
SRA、SAM以及Fastq文件高速下载方法
使用asperasoft高速下载SRA数据
【生信笔记】高速下载测序数据:Aspera的安装与使用
CellRanger走起(一)数据下载
使用Aspera从EBI或NCBI下载基因组数据 | Public Library of Bioinformatics
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服