Imaginad una empresa donde trabajan nueve personas. Tenemos al dueño de la empresa, que tiene asignado un sueldo de 6000€; después tenemos dos jefes de sección, cada uno de ellos con un sueldo de 1500€; dos encargados, cada uno de ellos con un sueldo de 1250€; y cuatro trabajadores de menor rango, que cobran 950€ cada uno. La media de estos sueldos es 1700€, pero en realidad solamente uno de los integrantes de la plantilla de esta empresa está por encima de 1700€. ¿De verdad alguien piensa que este dato puede ser representativo de los sueldos de la empresa?
El problema de la media es que es muy sensible a valores extremos. Es decir, si tenemos algún valor (o valores) que se aleje mucho del resto (ya sea porque sean mucho más grandes que los demás o muchos más pequeños) el resultado de la media será un valor que no representará fielmente la realidad que estamos intentando analizar.
Lo que uno quiere obtener es un valor intermedio, un valor que nos sirva para saber que la mitad de los salarios está por debajo de él y la otra mitad está por encima. En estadística existe una medida que calcula exactamente eso: la mediana.
La mediana es, precisamente, el parámetro estadístico que nos dice el valor que divide los datos en dos partes iguales si los ordenamos de menor a mayor. Es decir, la mediana nos da un valor que cumple que la mitad de los datos está por debajo de él y la otra mitad está por encima, que es lo que queremos.
La mediana es muy fácil de calcular (si tenemos los datos agrupados en intervalos, la cosa se complica un pelín, pero tampoco demasiado). Lo primero que hay que hacer es ordenar los datos de menor a mayor, y después nos fijamos en si tenemos un número par o un número impar de datos. Si el número de datos es impar, la mediana es el dato que haya quedado justo en el centro; y si el número de datos es par, para calcular la mediana tomamos los dos datos centrales, los sumamos y dividimos el resultado entre 2.
Vamos a calcular la mediana en el ejemplo de los sueldos. Tenemos nueve datos, y ordenados de menor a mayor quedan así:
950, 950, 950, 950, 1250, 1250, 1500, 1500, 6000
Como el número de datos es impar, la mediana es el dato central: 1250. ¿A que la mediana es más representativa de la situación real que la media?
<Artículo completo: https://elpais.com/elpais/2017/11/15/el_aleph/1510764756_471453.html>