Simulación de lecturas de secuenciación de ADN. El comando dwgsim es una herramienta para generar lecturas de secuenciación corta a partir de una secuencia de referencia en formato FASTA [formato de archivo, utilizado para representar secuencias de nucleótidos o de aminoácidos]. Está diseñado para simular datos de secuenciación moderna como los obtenidos en plataformas como Illumina y Roche 454, permitiendo un modelado realista de errores de secuenciación.
$ dwgsim -N 1000000 -1 100 -2 100 referencia.fasta salida
$ dwgsim -N 100000 -e 0.02 referencia.fasta salida_error
$ dwgsim -N 500000 -C 15 referencia.fasta salida_calidad
$ dwgsim -N 200000 -r 0.001 -R 0.001 referencia.fasta salida_indels
$ dwgsim -N 0 -c 30 referencia.fasta salida_cobertura
$ dwgsim -N 500000 -d 300 -s 50 -y 0.005 referencia.fasta salida_mutaciones