当前位置:网站首页 > 技术博客 > 正文

ftp传书



在有些科技论文中需要注明转录组测序的原始数据上传到NCBI的SRA数据库后获得的SRP号,以下是一个总体的流程,根据本人的数据上传经验整理,仅供参考

注册NCBI账号,首页Submit→Quick Start选择Nucleotide Sequence下的Sequence Read Archive(SRA)→GO→New submission新的提交,以下序号对应NCBI流程顺序

填写First name(名),Last name(姓),两个邮箱(一个可以用,163,fox邮箱,另一个可用谷歌,雅虎等邮箱)

Bioproject(生物项目),Biosample(生物样本),Release date(发布日期)都根据自己的需要选择,一般都需要新建

Project title和Public description这两项必填,根据自己的需要填写就可以了

根据自己的生物类型选择

选择:Upload a file using Excel or text format that includes the attributes for each of your BioSamples

下载文件:Download Excel或者Download TSV

填表:绿色区域必须都填,蓝色区域至少填一个,黄色区域可不填或删除,不知道的可以填not collected, not applicable or missing,其他注意事项表格里都有。

选择文件:上传→可能会出现错误,按提示修改就可以了

Upload a file using Excel or text format→Download Excel

★表格填完后要将第二个工作簿单独保存为TSV格式,可以将数据复制到txt中,保存再修改文件拓展名。

许多列都给出了可选项,可以直接选择,platform,instrument-model等可以从结题报告中查询,filename注意把文件格式填完整(注意.gz),不懂的看sheet1的说明和单元格的注释。

①下载并安装filezilla软件

②选择FTP or Aspera Command Line files for this submission

③复制Address,Username,Password分别到filezilla的主机,用户名,密码中,点击快速连接

④连接成功后,会显示目录读取失败,把Navigate to your account folder cd的:“upload/......”复制到filezilla的远程站点中,并建立子文件夹

⑤从本地站点中找到需要上传的raw date文件,选中右击上传到子文件夹中

★因为filezilla的传输速度较慢,且无线网及流量网络都存在断网可能,为了能够断点续传及减少传输失败的次数,必须要修改filezilla的以下设置:

设置-传输-对已存文件的操作-上传:继续文件传输

设置-连接-超时-超时秒数:60s(默认的20s)

设置-连接-重连设置-最大重试次数:99次(调到最大)

设置-连接-重连设置-登录重试延时:90s(调大一点,防止网络不稳定时频繁重连可能被服务器拉黑)

✦注:Filezilla断点续传的使用方式:

文件传输失败后,不要从“传输失败”中重置并重新请求,直接从本地站点中选择未完成的文件再次上传

⑥所有raw date的文件都上传完成后,select preload folder,选择在远程站点中建立的子文件夹,网页会对上传的数据进行处理,要稍等一会儿。

检查页面列出的信息,不对的可以回去修改,确认无误后提交。

需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,但是可以Email联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。

版权声明


相关文章:

  • 多目标优化算法(一)nsga-ⅱ(nsga2)2025-03-04 10:00:59
  • cas单点登录实现2025-03-04 10:00:59
  • 数据库外连接和内连接的区别2025-03-04 10:00:59
  • 深度信念网络和神经网络2025-03-04 10:00:59
  • linux中cp指令2025-03-04 10:00:59
  • csdn app积分在哪里看2025-03-04 10:00:59
  • verilog条件编译范例2025-03-04 10:00:59
  • 计算机组成原理百度文库2025-03-04 10:00:59
  • 那些神奇的代码2025-03-04 10:00:59
  • 碘测试有辐射吗2025-03-04 10:00:59