行业动态INDUSTRY DYNAMIC

干货|手把手教你上传微生物多样性原始数据!

来源:admin    发布时间:2020-09-01   阅读数:163

在文章发表时,大部分期刊要求将高通量测序数据上传至NCBI中,即SRA,Sequence Read Archive 高通量测序数据归档数据库,三大数据库SRA-ENA-DDBJ互联共享。

根据SRA数据产生的特点,将SRA数据分为四类:

Studies--研究课题

Experiments--实验设计

Runs--测序结果集

Samples--样品信息

SRA数据结构的层次关系为:Studies->Experiments->Samples->Runs. Studies就实验目标而言,一个study可能包含多个Experiment;Experiments包含了Sample、DNA source、测序平台、数据处理等信息;一个Experiment可能包含一个或多个Runs;Runs表示测序运行所产生的reads.

SRA数据用不同的前缀加以区分

EPR或SRP表示Studies

SRS表示Samples

SRX表示Experiments

SRR表示Runs

干货|手把手教你上传微生物多样性原始数据!


数据上传步骤

1、注册NCBI账号

2、Bioproject创建

3、Biosample创建

4、SRA run创建

(1)注册NCBI账号,NCBI网址:https://www.ncbi.nlm.nih.gov/,按照指引注册账号。 

(2)Bioproject创建

上传微生物多样性原始数据步骤

Tips:需要提供至少一个组织单位后缀的邮箱;提交者信息直接关联账号注册时信息,可以根据需要进行修改或补充;

上传微生物多样性原始数据步骤2

Tips:数据公开时间可以选定一年后,如果文章提前见刊,数据也会公开;前期已单独创建Bioproject和Biosample,此处可选择Yes,填写PRJN#,可关联SRA和Biosample;若没有单独创建Bioproject选择No则可以在SRA创建过程中补充相关信息。

上传微生物多样性原始数据步骤3

Tips:物种信息检索网址:

https://www.ncbi.nlm.nih.gov/Taxonomy/Browser/wwwtax.cgi;

Tips:确认信息无误点击提交,返回My submission,可以查看提交任务状态,如Awaiting process、Processed等,Processed表示已审核通过,拿到Biosample 编号,如PRJNA577630,后续创建Biosample/SRA run需提供。Publication可以将文章Pubmed ID或DOI与Bioproject关联;


3、Biosample创建

选取关键步骤进行说明:

上传微生物多样性原始数据步骤4

Tips:注意保持Biosample与Bioproject信息保持一致;微生物多样性数据/宏基因组数据均选择Metagenome。

上传微生物多样性原始数据步骤5

Tips:此处是Biosample创建最重要的步骤,需要提供Biosample attribute信息。


4、SRA run创建

选取关键步骤进行说明:

上传微生物多样性原始数据步骤6

Tips:小数据集可以直接通过web界面/Aspera上传。Aspera 更稳定,速度更快,下载地址如下:https://downloads.asperasoft.com/connect2//,大数据集建议通过FTP工具,或命令行版本的Aspera上传。

上传微生物多样性原始数据步骤7

Tips:确定无误后点击提交,同样在My submission可以查看提交任务状态,管理员审核通过后会反馈SRA编号,可以用作投稿时使用,如下图:

上传微生物多样性原始数据步骤8





您可能还喜欢:

瘤胃微生物的抗生素抗性基因鉴定

水稻驯化过程对种子内生细菌和真菌的影响



分享到: