Датотека:Number of prokaryotic genomes and sequencing costs.svg

Sadržaj stranice nije podržan na drugim jezicima
Ovo je datoteka sa Vikimedijine ostave
S Vikipedije, slobodne enciklopedije

Originalna datoteka(SVG datoteka, nominalno 1.350 × 900 piksela, veličina: 145 kB)

Opis izmene

Opis
English: Plot of the total number of prokaryotic genomes submitted to Genbank as a function of time. Based on data from genome reports and genome.gov. Subfigures: (A) Exponential growth of genome sequence databases since 1995. (B) The cost in US Dollars (USD) to sequence one million bases. (C) The cost in USD to sequence a 3,000 Mb (human-sized) genome on a log10 transformed scale.
Datum
Izvor Sopstveno delo
Autor Estevezj
Ostale verzije This file was derived from: Bacterial and archeal genome sequences submitted to Genbank.svg
SVG genesis
InfoField
 
The SVG code is valid.
 
This chart was created with R.
 
 This file uses embedded text that can be easily translated using a text editor.
 
The file size of this SVG image may be irrationally large because its text has been converted to paths inhibiting translations.
Izvorni kod
InfoField

R code

# Download our tables from NCBI's FTP site. Accessed 14:30PST, 18 December 2012
prok <- read.table("ftp://ftp.ncbi.nlm.nih.gov/genomes/GENOME_REPORTS/prokaryotes.txt", sep="\t", comment.char="!", header=T)

# Pull release dates, while dropping rows lacking a release date.
prok  <- as.Date(prok$Release.Date[prok$Release.Date != '-'],format="%Y/%m/%d")

# Bin our dates by month and year, tabulate, and save to a dataframe.
prok.cut <- as.data.frame( 
table(
  as.Date(
    cut(prok, "month")
  )
)
)

# Correct our column titles, calculate a running total, and reconvert from factor to date
colnames(prok.cut) <- c("Date", "Total")
prok.cut$Total <- cumsum(prok.cut$Total)
prok.cut$Date <- as.Date(prok.cut$Date)

# DNA Sequencing Costs from NHGRI: http://www.genome.gov/sequencingcosts/
# Data from http://www.genome.gov/pages/der/sequencing_cost.pptx

# After munging the pptx, download the tables from pastebin. Accessed 12:42PST, 2012-12-20
seq.cost <- read.table("http://pastebin.com/raw.php?i=NA6c4i70", header=TRUE)

# Format the date.
seq.cost$Date  <- as.Date(seq.cost$Date,format="%m-%d-%Y")

# Draw our plots
library("ggplot2")
library("grid")
library("scales")

(p <- ggplot(prok.cut, aes(Date, Total)) +  geom_area() +  ggtitle("Bacterial and archeal genome sequences submitted to Genbank") + xlab('Time') +  ylab("Total number of genomes")
)
(mb <- ggplot(seq.cost, aes(Date, USD.per.Mb)) + geom_point(colour = "blue") +
stat_smooth(color="#984EA3")+  
ggtitle("Cost to sequence one million nucleotides") +
xlab('Time') +
ylab("USD per MB") +
scale_y_continuous(labels = dollar)
)
(genome <- ggplot(seq.cost, aes(Date, USD.per.Genome)) + geom_point(colour = "red") +
stat_smooth(method='lm',color="#FC8D62")+  
ggtitle("Cost to sequence one human genome") +
xlab('Time') +
ylab("USD per genome") +
scale_y_log10(labels = dollar)
)
# This part is based on Hadley's Ggplot2 book (doi:10.1007/978-0-387-98141-3_8)
# Save our plot to SVG
library(grDevices)
svg(filename='ncbi-genomes.svg', width = 15, height = 10)
grid.newpage()
pushViewport(viewport(layout = grid.layout(2, 2)))
vplayout <- function(x, y)
viewport(layout.pos.row = x, layout.pos.col = y)
print(p, vp = vplayout(1, 1:2))
print(mb, vp = vplayout(2, 1))
print(genome, vp = vplayout(2, 2))
dev.off()

Licenciranje

Ja, nosilac autorskih prava nad ovim delom, objavljujem isto pod sledećim licencama:
w:sr:Krijejtiv komons
autorstvo deliti pod istim uslovima
Dozvoljeno je:
  • da delite – da umnožavate, raspodeljujete i prenosite delo
  • da prerađujete – da preradite delo
Pod sledećim uslovima:
  • autorstvo – Morate da date odgovarajuće zasluge, obezbedite vezu ka licenci i naznačite da li su izmene napravljene. Možete to uraditi na bilo koji razuman manir, ali ne na način koji predlaže da licencator odobrava vas ili vaše korišćenje.
  • deliti pod istim uslovima – Ako izmenite, preobrazite ili dogradite ovaj materijal, morate podeliti svoje doprinose pod istom ili kompatibilnom licencom kao original.
GNU head Data je dozvola da se kopira, distribuira i/ili menja ovaj dokument pod uslovima GNU-ove licence za slobodnu dokumentaciju, verzije 1.2 ili bilo koje novije verzije koju objavi Zadužbina za slobodni softver; bez nepromenljivih odeljaka i bez teksta na naslovnoj i zadnjoj strani. Tekst licence možete pročitati ovde.
Izaberite licencu po želji.

Natpisi

Dodajte objašnjenje u jednom redu o tome šta ova datoteka predstavlja

Stavke prikazane u ovoj datoteci

prikazuje

Neka vrednost bez stavke na projektu Vikipodaci

Vikimedija Serbian (transliteracija): Estevezj
skraćeno ime autora Serbian (transliteracija): Estevezj

status autorskog prava Serbian (transliteracija)

zaštićeno autorskim pravima Serbian (transliteracija)

izvor datoteke Serbian (transliteracija)

sopstveno delo Serbian (transliteracija)

20. decembar 2012

Istorija datoteke

Kliknite na datum/vreme da biste videli tadašnju verziju datoteke.

Datum/vremeMinijaturaDimenzijeKorisnikKomentar
trenutna07:04, 21. decembar 2012.Minijatura za verziju na dan 07:04, 21. decembar 2012.1.350 × 900 (145 kB)EstevezjAdded subplot labels.
06:50, 21. decembar 2012.Minijatura za verziju na dan 06:50, 21. decembar 2012.1.350 × 900 (107 kB)Estevezj{{Information |Description ={{en|1=Plot of the total number of prokaryotic genomes submitted to Genbank as a function of time. Based on data from [http://www.ncbi.nlm.nih.gov/genome genome reports] and [http://www.genome.gov/sequencingcosts/ genome....

Sledeća stranica koristi ovu datoteku:

Globalna upotreba datoteke

Drugi vikiji koji koriste ovu datoteku:

Metapodaci