V
e
r

l
i
s
t
a
d
o

tractatus@lapipaplena:/# _

 

datamash

Herramienta de estadísticas. Realiza operaciones numéricas y estadísticas básicas en archivos de datos textuales de entrada. Incluye la herramienta decorate. Los ejemplos en el directorio /usr/share/doc/datamash/examples/. Algunas opciones: count [num de elementos], sum [suma], min [elemento más bajo], max [el mayor], mean [la media], median [el del medio]...

$ seq 7 12 | datamash count 1
el número de elementos de la primera parte es 6
$ seq 3 | datamash max 1 min 1 mean 1 median 1
el máximo, el minimo, la media y el del medio
$ datamash -g 2 min 3 max 3 < /usr/share/doc/datamash/examples/scores.txt
encuentre el puntaje más bajo [mín.] y más alto [máx.] para cada especialidad universitaria, la especialidad está en la columna 2, los valores de puntaje están en la columna 3
$ datamash -g 2 mean 3 sstdev 3 < /usr/share/doc/datamash/examples/scores.txt
encuentre el número de estudiantes, la puntuación media y la desviación estándar de la muestra para cada especialidad universitaria

Una línea de encabezado es una primera línea opcional en los archivos de entrada o salida, que etiqueta cada columna. Datamash puede generar una línea de encabezado en el archivo de salida, incluso si el archivo de entrada no tiene una línea de encabezado (scores.txt no tiene una línea de encabezado, la primera línea del archivo contiene datos). Use --header-out para agregar una línea de encabezado a la salida (cuando la entrada no contiene una línea de encabezado):

$ datamash --header-out -g 2 count 3 mean 3 pstdev 3 < /usr/share/doc/datamash/examples/scores.txt
$ datamash -s -g 13 count 2 < /usr/share/doc/datamash/examples/genes.txt
agrupar por columna 13 y, para cada grupo, cuente los valores en la columna 2. -s para ordenar automáticamente el archivo de entrada
$ datamash -s -g 13 count 2 collapse 2 < /usr/share/doc/datamash/examples/genes.txt
usando la operación de collapse, datamash puede imprimir todas las isoformas de cada gen
$ datamash -H -s -g 13 count 2 collapse 2 < /usr/share/doc/datamash/examples/genes.txt
al utilizar un archivo con una línea de encabezado, agregar -H
$ echo -e '1.0\n2.5\n3.1\n4.3\n5.6\n5.7' | tr '.' ',' | datamash mean 1
Obtener la media de una sola columna de números flotantes, los flotantes deben usar "," y no "."
$ echo -e '1\n2\nNa\n3\nNaN' | datamash --narm mean 1
Obtener la media de una sola columna de números ignorando las cadenas "Na" y "NaN" literales
$ echo '3,14 42 1000 -51' | tr ' ' '\n' | datamash sum 1

1.-

$ cat table.txt

brown bread mat hair 42

blue cake mug shirt -7

yellow banana window shoes 3.14

$ datamash -t' ' sum 5 <table.txt
caracteres separados por espacios, sumar el 5º

38.14

2.-

$ cat scores.csv

Name,Maths,Physics,Chemistry

Ith,100,100,100

Cy,97,98,95

Lin,78,83,80

Er,60,70,90

$ datamash -t, transpose <scores.csv

Name,Ith,Cy,Lin,Er

Maths,100,97,78,60

Physics,100,98,83,70

Chemistry,100,95,80,90

3.-

$ cat toys.txt

car blue

car red

car yellow

truck brown

bus green

bus maroon

rocket white

$ datamash -t' ' -g1 collapse 2 <toys.txt

car blue,red,yellow

truck brown

bus green,maroon

rocket white

$ datamash -t' ' -g1 count 2 rand 2 <toys.txt

car 3 red

truck 1 brown

bus 2 green

rocket 1 white

Navegando por staredsi.eu aceptas las cookies que utilizamos en esta web. Más información: Ver política de cookies
[0] 0:bash*
3198 entradas - Acerca del Tractatus
La Pipa Plena 2025