Assembly merge: Difference between revisions

From Cbcb
Jump to navigation Jump to search
Line 28: Line 28:
== Pseudomonas_syringae ==
== Pseudomonas_syringae ==


Assemblies
Reference:


   assembler   type        #ctgs   min    max    mean            stdev          sum
   Name          Length %GC
   AMOScmp    comparative 187    20      577929  34863.06        91692.34        6519394
   NC_004578.1    6397126 58.40
   NC_004633.1    73661  55.15
   NC_004632.1    67473 56.17


  edena      denovo      14084  100    5075    210.92          145.68          2970720
Data:
  velvet      denovo      25161  45      5057    241.83          212.61          6084887


   edena-sim  denovo      2068    100    47881  2994.03        4857.76        6191673
  Type            #reads      min    max    mean
   velvet-sim  denovo      2207    45      56810  2820.91        5348.36        6225757
  Solexa          6340136      32      32      32
  Sim(ulated)    6538167      32      32      32
  454            77466        35      371    240
 
Assemblies:
 
  assembler  type        data    #ctgs  min    max    mean            stdev          ctgs-sum       
  AMOScmp    comparative  Solaxa  187    20      577929  34863.06        91692.34        6519394     
 
  edena      denovo      Solaxa  14084  100    5075    210.92          145.68          2970720
  velvet      denovo      Solaxa  25161  45      5057    241.83          212.61          6084887
 
   edena-sim  denovo      Sim    2068    100    47881  2994.03        4857.76        6191673
   velvet-sim  denovo      Sim    2207    45      56810  2820.91        5348.36        6225757

Revision as of 18:03, 27 March 2008

Cases

No reference assembly

One data set, multiple denovo assemblers

Example:

 * Solexa data
 * edena & velvet assemblers

Solutions:

 * merge 2 assembly sets
 * run minimus on them

Multipls data sets, one(multiple) denovo assemblers

Example:

 Solexa & 454 data
 velvet assemblers for each set

One reference assembly

Multiple reference assemblies


Examples

Pseudomonas_syringae

Reference:

 Name           Length %GC
 NC_004578.1    6397126 58.40
 NC_004633.1    73661  55.15
 NC_004632.1    67473  56.17

Data:

 Type            #reads       min     max     mean
 Solexa          6340136      32      32      32
 Sim(ulated)     6538167      32      32      32
 454             77466        35      371     240

Assemblies:

 assembler   type         data    #ctgs   min     max     mean            stdev           ctgs-sum        
 AMOScmp     comparative  Solaxa  187     20      577929  34863.06        91692.34        6519394      
 edena       denovo       Solaxa  14084   100     5075    210.92          145.68          2970720
 velvet      denovo       Solaxa  25161   45      5057    241.83          212.61          6084887
 edena-sim   denovo       Sim     2068    100     47881   2994.03         4857.76         6191673
 velvet-sim  denovo       Sim     2207    45      56810   2820.91         5348.36         6225757