Assembly merge: Difference between revisions

From Cbcb
Jump to navigation Jump to search
Line 29: Line 29:


Reference:
Reference:
   Name          Length %GC
   Name          Length %GC
   NC_004578.1    6397126 58.40
   NC_004578.1    6397126 58.40
   NC_004633.1    73661 55.15
   NC_004633.1    73661   55.15
   NC_004632.1    67473 56.17
   NC_004632.1    67473   56.17


Repeats:
Repeats:
Line 46: Line 46:


Single assemblies:
Single assemblies:
   assembler   type        input-data     #reads   #ctgs  min    max    mean           stdev           ctgs-sum      
   Assembler   type        input-data #reads         #ctgs  min    max    mean     stdev     ctgs-sum     #singl  singl-sum
 
   edena      denovo      Solaxa     6340136       14084  100    5075    210.92   145.68   2970720       4893301
   edena      denovo      Solaxa         6340136 14084  100    5075    210.92         145.68         2970720
   velvet      denovo      Solaxa     6340136       25161  45      5057    241.83   212.61   6084887
   velvet      denovo      Solaxa         6340136 25161  45      5057    241.83         212.61         6084887
   edena-sim  denovo      Sim         6538167       2068    100    47881  2994.03   4857.76   6191673       668
 
   velvet-sim  denovo      Sim         6538167       2207    45      56810  2820.91   5348.36   6225757
   edena-sim  denovo      Sim           6538167 2068    100    47881  2994.03         4857.76         6191673
   AMOScmp    comparative  Solaxa     6340136       187    20      577929  34863.06 91692.34 6519394       698638
   velvet-sim  denovo      Sim           6538167 2207    45      56810  2820.91         5348.36         6225757
 
   AMOScmp    comparative  Solaxa         6340136 187    20      577929  34863.06       91692.34       6519394    


Merged assemblies:
Merged assemblies:
   assemblers    type        input-data  #reads  #ctgs  min    max    mean            stdev          ctgs-sum         
   assemblers    type        input-data  #reads  #ctgs  min    max    mean            stdev          ctgs-sum         
   edena+velvet  denovo      contigs    39245
   edena+velvet  denovo      contigs    39245

Revision as of 18:30, 27 March 2008

Cases

No reference assembly

One data set, multiple denovo assemblers

Example:

 * Solexa data
 * edena & velvet assemblers

Solutions:

 * merge 2 assembly sets
 * run minimus on them

Multipls data sets, one(multiple) denovo assemblers

Example:

 Solexa & 454 data
 velvet assemblers for each set

One reference assembly

Multiple reference assemblies


Examples

Pseudomonas_syringae

Reference:

 Name           Length  %GC
 NC_004578.1    6397126 58.40
 NC_004633.1    73661   55.15
 NC_004632.1    67473   56.17

Repeats:

 desc    #repeats   min     max     mean    stdev    sum
 50bp+   991        50      7362    393.73  792.41   390192
 100bp+  429        100     7362    815.36  1060.29  349793

Data:

 Type            #reads       min     max     mean
 Solexa          6340136      32      32      32
 Sim(ulated)     6538167      32      32      32
 454             77466        35      371     240

Single assemblies:

 Assembler   type         input-data  #reads         #ctgs   min     max     mean      stdev     ctgs-sum      #singl  singl-sum
 edena       denovo       Solaxa      6340136        14084   100     5075    210.92    145.68    2970720       4893301
 velvet      denovo       Solaxa      6340136        25161   45      5057    241.83    212.61    6084887
 edena-sim   denovo       Sim         6538167        2068    100     47881   2994.03   4857.76   6191673       668
 velvet-sim  denovo       Sim         6538167        2207    45      56810   2820.91   5348.36   6225757
 AMOScmp     comparative  Solaxa      6340136        187     20      577929  34863.06  91692.34  6519394       698638

Merged assemblies:

 assemblers     type         input-data  #reads  #ctgs   min     max     mean            stdev           ctgs-sum        
 edena+velvet   denovo       contigs     39245