Buscar

miércoles, 10 de abril de 2013

Cuestiones sobre distribución normal estándar



En esta entrada vamos a considerar que los beneficios anuales (medidos en miles de euros) de las empresas de un cierto sector siguen una distribución aproximadamente normal de media 10 y desviación estándar 2. Si denotamos por Z una distribución normal estándar, ¿qué porcentaje aproximado de empresas obtienen beneficios por encima de 7000 euros?
a) 7%, que podemos calcular como P( Z < (10-7)/2 ) = 0,06681
b) 7%, que podemos calcular como P( Z < (7-10)/2 ) = 0,06681
c) 93%, que podemos calcular como P( Z < (10-7)/2 ) = 0,93319
d) 93%, que podemos calcular como P( Z < (7-10)/2 ) = 0,93319

Segundo, para una distribución N(µ, σ), qué de las siguientes afirmaciones es falsa. Aproximadamente,

a) el 95% de las observaciones se encuentran a una distancia menor a 2∙σ de µ
b) el 5% de las observaciones se encuentran a una distancia superior a 2∙σ de µ
c) el 97,5% de las observaciones se encuentran a una distancia menor a 2 ∙σ de µ
d) el 2,5% de las observaciones resultan superiores a µ + 2∙σ

 Solución primera cuestión: c)

Sea X la variable que mide (en miles de euros) los beneficios de las empresas del sector; del enunciado conocemos que X se distribuye según una ley N(10, 2). Estamos interesados en P(X > 7).

Las opciones a) y b) tienen que ser descartadas inicialmente pues 7 es inferior a la media de la distribución y, por lo tanto P(X > 7), es superior a P(X > 10) = 0,5 y por lo tanto el porcentaje pedido es superior al 50%.
Estandarizando tenemos que P(X > 7) = P(Z > (7-10)/2) donde Z es una variable distribuida según una N(0,1). Si recordamos la simetría de la distribución normal estándar, P(Z > (7-10)/2) = P(Z < (10-7)/2) = 0,9332 y por lo tanto la opción correcta es la c).

A la segunda cuestión: c)

Según la regla del 68-95-99,7, el 95% de las unidades de la población tienen valores entre la media menos dos desviaciones estándar y la media más dos desviaciones estándar, el que valida la opción a). Observamos que por la misma razón la opción b) es cierta pues el 5% de las observaciones restantes quedarían , o bien por sobre µ + 2∙σ o bien por debajo de µ - 2∙σ. Esta repartición del 5% restante es simétrica resultando el 2,5% de las unidades de la población por sobre µ + 2∙σ y el 2,5% por debajo de µ - 2∙σ con el que la opción d) también es cierta. La afirmación falsa era pues la c)

Observamos que si que sería cierto el hecho que el 97,5% de las observaciones resulta inferior a µ + 2∙σ pero no todas estas se encuentran a una distancia menor a 2∙σ de µ: por ejemplo µ - 3∙σ es claramente inferior a µ + 2∙σ pero su distancia a µ es igual a 3∙σ.

No hay comentarios:

Publicar un comentario