Name: COVID-19 Genome Sequence Dataset
License: NIH Genomic Data Sharing Policy

bam bioinformatics biology coronavirus COVID-19 cram fastq genetic genomic health life sciences MERS SARS STRIDES transcriptomics virus whole genome sequencing

Description

This repository within the ACTIV TRACE initiative houses a comprehensive collection of datasets related to SARS-CoV-2. The processing of SARS-CoV-2 Sequence Read Archive (SRA) files has been optimized to identify genetic variations in viral samples. This information is then presented in the Variant Call Format (VCF). Each VCF file corresponds to the SRA parent-run's accession ID. Additionally, the data is available in the parquet format, making it easier to search and filter using the Amazon Athena Service. The SARS-CoV-2 Variant Calling Pipeline is designed to handle new data every six hours, with updates to the AWS ODP bucket occurring daily.

Update Frequency

Daily

How to Cite

COVID-19 Genome Sequence Dataset was accessed on DATE from https://registry.opendata.aws/ncbi-covid-19.

Usage Examples

Tools & Applications

Download SRA sequence data using Amazon Web Services (AWS) by NCBI SRA

Resources on AWS

Description

Genetic variations of SARS-CoV-2 in VCF format, organized by NCBI accession. Each VCF file corresponds to the SRA parent-run's accession ID. Files in the vcf folder are in VCF and can be read by any program that accepts *.vcf files or can read tabular data.

Resource type

S3 Bucket

Amazon Resource Name (ARN)

arn:aws:s3:::sra-pub-sars-cov2

AWS Region

us-east-1

AWS CLI Access (No AWS account required)

aws s3 ls --no-sign-request s3://sra-pub-sars-cov2/
Description

Metadata for sra-pub-sars-cov2 in an Athena-queryable format

Resource type

S3 Bucket

Amazon Resource Name (ARN)

arn:aws:s3:::sra-pub-sars-cov2-metadata-us-east-1

AWS Region

us-east-1

AWS CLI Access (No AWS account required)

aws s3 ls --no-sign-request s3://sra-pub-sars-cov2-metadata-us-east-1/

COVID-19 Genome Sequence Dataset

Description

Update Frequency

License

Documentation

Managed By

Contact

How to Cite

Usage Examples

Tools & Applications

Resources on AWS