sábado, 16 de mayo de 2015

Practica 4. Clarisa Simental

Ejemplo.
El departamento de queja de McFarland Insurance Company informa que el costo medio para tramitar una queja es de $60. Una comparación en la industria demostró que esta cantidad es mayor que en la demás de compañías de seguros, así que la compañía tomo medidas para reducir gastos. Para evaluar el efecto de las medidas de reducción de gastos, el supervisor del departamento de quejas selecciono una muestra aleatoria de 26 que el mes pasado.La información de la muestra aparece a continuación.

$45
$49|
$62|
$40
$43
$61
48
53
67
63
78
64
48
54
51
56
63
69
58
51
58
59
56
57
38
76





Es razonable concluir que el costo medio de atención de una queja ahora es menor  a $60 con un nivel de significancia de 0.01?

Aplique la prueba de hipótesis con el procedimiento de 5 pasos.

Paso 1.



La prueba es de una cola, pues desea determinar si hubo una reducción en el costo. La desigualdad de la hipótesis alternativa señala la región de rechazo en la cola izquierda de la distribución.

Paso 2.

El nivel de significancia es 0.01

Paso 3.
El estadístico de la prueba es  la distribución t porque resulta razonable concluir que la distribución del costo por queja sigue la distribución normal. 


No  se conoce la desviación estándar de la población, por lo que esta se sustituye por la desviación estándar de la muestra. El valor del estadístico de la prueba se calcula por medio de la formula.



Paso 4.
Los valores críticos de t aparecen en el apéndice b2 una parte del cual se produce en la tabla 10-1.La columna extrema izquierda de la tabla esta rotulada como gl, que representa los grados de libertad. El numero de grados de libertad es el total de observaciones incluidas en la muestra menos el numero de poblaciones muestreadas, lo cual se escribe n-1. Aquí el numero de observaciones  de la muestra es de 26, y se muestrea una población, asi que hay 26-1-25 grados de libertad.


El costo medio por queja de la muestra de 26 observaciones es de $56.42. La desviación estándar de esta muestra es de $10.04. A sustituir estos valores en la formula  de t obtenemos.

Paso 5.
Como el -1.818 se localiza en la región ubicada a la derecha del valor critico de -2.485, la Hipótesis nula no se rechaza con el nivel de significancia de 0.01. No se demostró que las medidas de reducción de costos hayan ajado el costo medio por queja a menos de $60.Es decir, la diferencia de $3.58 ($56.52-$60) entre la media muestral y la media poblacional puede deberse al error de muestreo.



Ejemplo 2.
Suponga que se está interesado en determinar si hay evidencia que el aumento de peso promedio de unos animales a los dos meses de aplicar una determinada dieta es de 20Kg. Se conoce que el aumento de peso sigue una distribución normal con varianza σ2=4kg
Primer paso:
Se tienen las siguientes hipótesis.
H0=20      y       H1≠20

Segundo paso:
El nivel de significancia o probabilidad de cometer un error Tipo I en esta prueba sería alfa=0.05
Se tomará una muestra de n=10 animales. Los datos son:
16.5
16.4
18.5
19.5
20.2
21.0
18.5
19.3
19.8
20.3

Tercer paso
Puesto que se conoce la varianza poblacional, la prueba estadística a utilizar es la prueba Z:
Cuarto paso graficamos el resultado.
Los valores críticos se determinan buscando en la tabla de distribución normal estándar acumulada el valor zde para un área de 0.025, el valor obtenido es z1=-1.96, el valor de z2 será el mismo z2=1.96, luego la regla de decisión para la hipótesis será no rechazar H0 si -1.96 zc 1.96

Quinto paso

Como la media muestral es 19, y la media de la población es 20 y se tiene que n=10,  entonces el valor de la estadística de prueba zc está dado por:
Se compara el valor calculado de la prueba con los valores críticos (obtenidos de la tabla de distribución normal estándar), para determinar si cae en la región de rechazo o de no rechazo. En este caso zc=-1.58. Se encuentra dentro de la región de no rechazo. En este caso no se rechaza la hipótesis nula.

Ejercicio 20.

Hugger Polls afirma que un agente realiza una media de 53 entrevistas extensas a domicilio a la semana. Se introdujo un nuevo formulario para las entrevistas, y Hugger desea evaluar su eficacia. La cantidad de entrevistas extensas por semana de una muestra aleatoria de agentes es:
53 57 50 55 58 54 60 52 59 62 60 60 51 59 56
Con un nivel de significancia de 0.05, ¿puede concluir que la cantidad media de entrevistas de los agentes es más de 53 a la semana?

H0<= 53      H1>53

Ya que el nivel de significancia de 0.05 se tiene que revisar en la tabla t student con un grado de libertad de 14, donde obtenemos  2.14, es decir si el valor de t calculado es menor a -2.14 la hipotesis nula se rechazara.

Encontramos el valor de la desviacion de la muestra y de la media de la muestra
obtenemos la media de la muestra
(53 + 57 + 50 + 55 + 58 + 54 + 60 + 52 + 59 + 62 + 60 + 60 + 51 + 59 + 56)/15
= 56.4
Despues la desviacion de la muestra se calcula siguiendo la regla de sumatoria de la raiz de ((Xi - 56.4)^2/14)=12.72

Obtenemos el valor de t donde tenemos que t=(x-μ)/(s/raiz(n-1))
por lo tanto t=(56.4-53)/(12.72/raiz(14))  siendo t= 1.000
Es decir nuestro 1 se encuentra dentro del intervalo donde se acepta H0,
por lo tanto la cantidad de entrevistas no es mayor a 53

jueves, 14 de mayo de 2015

Practica 3. Distribución Uniforme

 La distribución o modelo uniforme puede considerarse como proveniente de un proceso de extracción aleatoria .El planteamiento radica en el hecho de que la probabilidad se distribuye uniformemente a lo largo de un intervalo . Así : dada una variable aleatoria continua, x , definida en el intervalo [a,b] de la recta real, diremos que x tiene una distribución uniforme en el intervalo [a,b] cuando su función de densidad para  sea:  para x Î [a,b].


Su representación gráfica será :



De manera que la función de distribución resultará:


Su representación gráfica será :


Este modelo tiene la característica siguiente : Si calculamos la probabilidad del suceso 

                                                                        

                                Tendremos: 

                Este resultado nos lleva a la conclusión de que la probabilidad de cualquier suceso depende únicamente de la amplitud del intervalo (D X) , y no de su posición en la recta real [a , b] . Lo que viene ha demostrar el reparto uniforme de la probabilidad a lo largo de todo el campo de actuación de la variable , lo que , por otra parte, caracteriza al modelo.


En cuanto a las ratios de la distribución tendremos que la media tiene la expresión:



La varianza tendrá la siguiente expresión:


                                                de donde 

                                        por lo que 

Ejemplo:

1.- Un reloj de manecillas se detuvo en un punto que no sabemos. Determine la probabilidad de que se halla detenido en los primeros 25 minutos luego de señalar la hora en punto.

Solucion:

Interalo [0,60]

F(x )= 1/(60-0)  = 1/60



P(x) = P(0≤x≤25) = integral [0,25] 1/60 dx = 5/12 


miércoles, 13 de mayo de 2015

Practica 3. Distribucion Hipergeometrica- Kassandra Castro


Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantenía constante. Si el proceso consistía en una serie de extracciones o selecciones ello implicaba la reposición de cada extracción o selección , o bien la consideración de una población muy grande. Sin embargo si la población es pequeña y las extracciones no se remplazan las probabilidades no se mantendrán constantes . En ese caso las distribuciones anteriores no nos servirán para la modelizar la situación. La distribución hipergeométrica viene a cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no constantes (sin reemplazamiento) .




Practica 3. Disribucion Binomial Negativa- Kassandra Castro



Esta distribución puede considerarse como una extensión o ampliación de la distribución geométrica . La distribución binomial negativa es un modelo adecuado para tratar aquellos procesos en los que se repite un determinado ensayo o prueba hasta conseguir un número determinado de resultados favorables (por vez primera) .Es por tanto de gran utilidad para aquellos muestreos que procedan de esta manera. Si el número de resultados favorables buscados fuera 1 estaríamos en el caso de la distribución geométrica . Está implicada también la existencia de una dicotomía de resultados posibles en cada prueba y la independencia de cada prueba o ensayo, o la reposición de los individuos muestreados



jueves, 7 de mayo de 2015

Practica 3. Ji- Cudrada- Clarisa Simental

La distribución Chi-Cuadrada (chi squared en inglés, se pronuncia “Kay Cuadrada skuerd”) es una de las distribuciones más empleadas en todos los campos. Su uso más común es cuando se quiere probar si unas mediciones que se hayan efectuado siguen una distribución esperada, por ejemplo la normal o cualquier otra. Otro de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o desviaciones estándar. Empezaremos ilustrando la definición de la distribución para proceder a ejemplos de uso práctico.

Supongamos que se efectúa el siguiente experimento estadístico.Seleccionamos una muestra aleatoria de tamaño n de una población con distribución normal, con desviación estandar igual a σ. 

De la muestra encontramos que la desviación estandar es igual a s. Con estos datos podemos calcular una estadística, que llamamos Chi-Cuadrada Cuadrada, por medio de la siguiente ecuación: 

La media es igual al número de grados de libertad libertad (que es igual al tamaño
de las muestras menos 1): 
μ = ν = n – 1

•La varianza es igual a dos veces el número de grados de libertad libertad (por lo tanto la desviación estándar es la raíz cuadrada cuadrada de 2ν):
σ2 = 2 * ν


Ejemplo 1.
El espesor de un semiconductor se controla mediante la variación estándar no mayor a s=0.60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamaño de 20 unidades, y se considera que el sistema está fuera de control cuando la probabilidad de que s^2 tome valor mayor o igual al valor de la muestra observado es que es 0.01. Que se puede concluir si s=0.84mm?

Solución. 
Existe fuera de control si


 con n=20 y s=0.60,  excede

Entonces  

  
Por tanto, el sistema está fuera de control.

Un farmacéutico Jefe del Dpto. Control de Calidad en una industria alimenticia, descubre que en su proceso de producción el contenido de ciclamato en su línea de mermeladas dietéticas varía en forma indeseada. Sospechando que se trata de una falla en el dosificador, decide tomar 10 muestras seguidas del mismo. Encuentra un promedio de 20 gramos con una desviación de 8 gramos. Si en su protocolo de fabricación la variación máxima permitida es del 3%, determinar si el dosificador debe ser corregido.
El desviación estándar aceptable es: smáx = 3% de 20 g = 6 g. Luego:
H0:smáx ≤6 g.: el dosificador funciona correctamente
H1:smáx > 6 g.: el dosificador debe ser cambiado


Ejercicio excel.

Exisisten diferencias significativas en el estado nutricional entre hombres y mujeres?
Hipotesis Nula, Ho: Estado nutricional de los hombres es igual al de las mujeres.
Hipotesis Alternativa, Ha: El estado nutricional de los hombres no es igual al de las  mujeres..
Nivel de confianza 95%, solo se rechaza Ho si el valor de p que resulte es menor de 0.05
Distribucion de frecuencias del IMC según sexo
IMC Hombre Mujeres Total
Bajo peso 33 78 111
Normal 525 446 971
Obesidad 155 333 488
Sobrepeso 454 498 952
Total 1167 1355 2522

En excel: Complementos- Stat Plus-Table Statics-selecciona las celdas sin lostotales- output-ok-cualquier celda no ocupada-ok.