Buscar

viernes, 12 de abril de 2013

Estadísticos descriptivos de una variable



En esta entrada se expone el siguiente problema:

La línea aérea LA quiere optimizar el rendimiento de su trayecto Barcelona – Madrid en hora punta (de las 7:00 a las 9:00). Concretamente querría minimizar el número de asientos vacíos en este trayecto y franja horaria. A tal efecto, se ha contabilizado el número de asientos vacíos en 30 vuelos de estas características (franja horaria y línea aérea) de Barcelona en Madrid. La información obtenida es la siguiente:

5, 6, 9, 8, 8, 5, 9, 9, 7, 6, 6, 7, 6, 7, 7 9, 9, 8, 9, 8, 6, 6, 5, 7, 6, 7, 7, 8, 7, 9

Se pide:

a) Calcular con Minitab los estadísticos descriptivos de la variable número de asientos vacíos y representáis los datos con un diagrama de caja. Engancháis los resultados obtenidos en vuestro documento de respuestas.
b) ¿Teniendo en cuenta los resultados del apartado anterior, qué número de asientos vacíos sería más representativo del trayecto estudiado?
c) Disponemos de otro conjunto de datos, correspondiendo al número de personas que viajan (en un vuelo de las características examinadas) con alguno sentando vacío al lado, del cual sabemos que la desviación típica muestral es s = 10,9. ¿Podemos afirmar que estos segundos datos son más dispersas que las primeras?


a) La opción de menú de Minitab, Stat > Basic Statistics > Display Descriptive Statistics, nos permitirá obtener los estadísticos descriptivos. Hemos creado una variable que se llama Asientos, donde se encuentra la información, en términos de asientos vacíos, del enunciado. Pasamos la columna Asientos a la caja Variables y validamos, obteniendo
Variable N Mean Median TrMean StDev SE Mean

Asientos 30 7,200 7,000 7,214 1,324 0,242

Variable Minimum Maximum Q1 Q3
Asientos 5,000 9,000 6,000 8,000

Para construir el gráfico haremos uso de las opciones de menú Graph > Box Plot. Pasamos la variable Asientos a la columna 1, hila 1 y validamos. Obtendremos, 




b) Es una distribución prácticamente simétrica, tal y cómo se observa a la representación gráfica anterior. Así pues podemos afirmar que tanto la mediana como la media serán medidas de centralidad representativas de la distribución. Diremos que el número de asientos vacíos más representativo de este trayecto es 7, pues la mediana es igual a 7 y la media es igual a 7,2 asientos vacíos.


c) No podemos afirmar que los datos con desviación típica sean más dispersas que las descritas anteriormente pues las muestras se expresan en unidades diferentes: el grupo de observaciones que analizamos cuenta el número de asientos vacíos pero este segundo grupo examina el número de personas que viajan con alguno sentando vacío. Necesitaríamos  la media de la segunda muestra porque así, mediante el coeficiente de Variación de Pearson, poder compararlas.

No hay comentarios:

Publicar un comentario