Assembly merge: Difference between revisions

From Cbcb
Jump to navigation Jump to search
Line 29: Line 29:


Reference:
Reference:
   Name          Length %GC
   Name          Length %GC
   NC_004578.1    6397126 58.40
   NC_004578.1    6397126 58.40
   NC_004633.1    73661  55.15
   NC_004633.1    73661  55.15
   NC_004632.1    67473  56.17
   NC_004632.1    67473  56.17
Repeats:
  desc    #elem  min    max    mean    stdev  sum
  50bp+  991    49      7361    392.73  792.41  389201
  100bp+  429    99      7361    814.36  1060.29 349364


Data:
Data:
   Type            #reads      min    max    mean
   Type            #reads      min    max    mean
   Solexa          6340136      32      32      32
   Solexa          6340136      32      32      32
Line 42: Line 45:
   454            77466        35      371    240
   454            77466        35      371    240


Assemblies:
Single assemblies:
 
   assembler  type        input-data     #reads  #ctgs  min    max    mean            stdev          ctgs-sum         
   assembler  type        data   #ctgs  min    max    mean            stdev          ctgs-sum         
    
   AMOScmp    comparative  Solaxa  187    20      577929  34863.06        91692.34        6519394     
   edena      denovo      Solaxa         6340136 14084  100    5075    210.92          145.68          2970720
 
   velvet      denovo      Solaxa         6340136 25161  45      5057    241.83          212.61          6084887
   edena      denovo      Solaxa  14084  100    5075    210.92          145.68          2970720
 
   velvet      denovo      Solaxa  25161  45      5057    241.83          212.61          6084887
  edena-sim  denovo      Sim            6538167  2068    100    47881  2994.03        4857.76        6191673
  velvet-sim  denovo      Sim            6538167  2207    45      56810  2820.91        5348.36        6225757
 
  AMOScmp    comparative  Solaxa        6340136  187    20      577929  34863.06        91692.34        6519394     


   edena-sim   denovo      Sim     2068    100     47881  2994.03        4857.76        6191673
Merged assemblies:
   velvet-sim  denovo      Sim     2207    45      56810  2820.91        5348.36        6225757
   assemblers    type        input-data  #reads  #ctgs   min     max     mean            stdev          ctgs-sum       
   edena+velvet   denovo      contigs     39245

Revision as of 18:14, 27 March 2008

Cases

No reference assembly

One data set, multiple denovo assemblers

Example:

 * Solexa data
 * edena & velvet assemblers

Solutions:

 * merge 2 assembly sets
 * run minimus on them

Multipls data sets, one(multiple) denovo assemblers

Example:

 Solexa & 454 data
 velvet assemblers for each set

One reference assembly

Multiple reference assemblies


Examples

Pseudomonas_syringae

Reference:

 Name           Length %GC
 NC_004578.1    6397126 58.40
 NC_004633.1    73661  55.15
 NC_004632.1    67473  56.17

Repeats:

 desc    #elem   min     max     mean    stdev   sum
 50bp+   991     49      7361    392.73  792.41  389201
 100bp+  429     99      7361    814.36  1060.29 349364

Data:

 Type            #reads       min     max     mean
 Solexa          6340136      32      32      32
 Sim(ulated)     6538167      32      32      32
 454             77466        35      371     240

Single assemblies:

 assembler   type         input-data     #reads   #ctgs   min     max     mean            stdev           ctgs-sum        
 
 edena       denovo       Solaxa         6340136  14084   100     5075    210.92          145.68          2970720
 velvet      denovo       Solaxa         6340136  25161   45      5057    241.83          212.61          6084887
 
 edena-sim   denovo       Sim            6538167  2068    100     47881   2994.03         4857.76         6191673
 velvet-sim  denovo       Sim            6538167  2207    45      56810   2820.91         5348.36         6225757
 
 AMOScmp     comparative  Solaxa         6340136  187     20      577929  34863.06        91692.34        6519394      

Merged assemblies:

 assemblers     type         input-data  #reads  #ctgs   min     max     mean            stdev           ctgs-sum        
 edena+velvet   denovo       contigs     39245