martes, 26 de mayo de 2015
sábado, 16 de mayo de 2015
Practica 4. Clarisa Simental
Ejemplo.
El departamento de queja de McFarland Insurance Company informa que el costo medio para tramitar una queja es de $60. Una comparación en la industria demostró que esta cantidad es mayor que en la demás de compañías de seguros, así que la compañía tomo medidas para reducir gastos. Para evaluar el efecto de las medidas de reducción de gastos, el supervisor del departamento de quejas selecciono una muestra aleatoria de 26 que el mes pasado.La información de la muestra aparece a continuación.
El departamento de queja de McFarland Insurance Company informa que el costo medio para tramitar una queja es de $60. Una comparación en la industria demostró que esta cantidad es mayor que en la demás de compañías de seguros, así que la compañía tomo medidas para reducir gastos. Para evaluar el efecto de las medidas de reducción de gastos, el supervisor del departamento de quejas selecciono una muestra aleatoria de 26 que el mes pasado.La información de la muestra aparece a continuación.
$45
|
$49|
|
$62|
|
$40
|
$43
|
$61
|
48
|
53
|
67
|
63
|
78
|
64
|
48
|
54
|
51
|
56
|
63
|
69
|
58
|
51
|
58
|
59
|
56
|
57
|
38
|
76
|
Es razonable concluir que el costo medio de atención de una queja ahora es menor a $60 con un nivel de significancia de 0.01?
Aplique la prueba de hipótesis con el procedimiento de 5 pasos.
Paso 1.
La prueba es de una cola, pues desea determinar si hubo una reducción en el costo. La desigualdad de la hipótesis alternativa señala la región de rechazo en la cola izquierda de la distribución.
Paso 2.
El nivel de significancia es 0.01
Paso 3.
El estadístico de la prueba es la distribución t porque resulta razonable concluir que la distribución del costo por queja sigue la distribución normal.
No se conoce la desviación estándar de la población, por lo que esta se sustituye por la desviación estándar de la muestra. El valor del estadístico de la prueba se calcula por medio de la formula.
Los valores críticos de t aparecen en el apéndice b2 una parte del cual se produce en la tabla 10-1.La columna extrema izquierda de la tabla esta rotulada como gl, que representa los grados de libertad. El numero de grados de libertad es el total de observaciones incluidas en la muestra menos el numero de poblaciones muestreadas, lo cual se escribe n-1. Aquí el numero de observaciones de la muestra es de 26, y se muestrea una población, asi que hay 26-1-25 grados de libertad.
El costo medio por queja de la muestra de 26 observaciones es de $56.42. La desviación estándar de esta muestra es de $10.04. A sustituir estos valores en la formula de t obtenemos.
Paso 5.
Como el -1.818 se localiza en la región ubicada a la derecha del valor critico de -2.485, la Hipótesis nula no se rechaza con el nivel de significancia de 0.01. No se demostró que las medidas de reducción de costos hayan ajado el costo medio por queja a menos de $60.Es decir, la diferencia de $3.58 ($56.52-$60) entre la media muestral y la media poblacional puede deberse al error de muestreo.
Ejemplo 2.
Suponga que se está interesado en determinar si hay evidencia que el aumento de peso promedio de unos animales a los dos meses de aplicar una determinada dieta es de 20Kg. Se conoce que el aumento de peso sigue una distribución normal con varianza σ2=4kg
Primer paso:
Se tienen las siguientes hipótesis.
H0=20 y H1≠20
Segundo paso:
El nivel de significancia o probabilidad de cometer un error Tipo I en esta prueba sería alfa=0.05
Se tomará una muestra de n=10 animales. Los datos son:
16.5
16.4
18.5
19.5
20.2
21.0
18.5
19.3
19.8
20.3
Tercer paso
Puesto que se conoce la varianza poblacional, la prueba estadística a utilizar es la prueba Z:
Cuarto paso graficamos el resultado.
Los valores críticos se determinan buscando en la tabla de distribución normal estándar acumulada el valor zde para un área de 0.025, el valor obtenido es z1=-1.96, el valor de z2 será el mismo z2=1.96, luego la regla de decisión para la hipótesis será no rechazar H0 si -1.96 zc 1.96
Quinto paso
Como la media muestral es 19, y la media de la población es 20 y se tiene que n=10, entonces el valor de la estadística de prueba zc está dado por:
Se compara el valor calculado de la prueba con los valores críticos (obtenidos de la tabla de distribución normal estándar), para determinar si cae en la región de rechazo o de no rechazo. En este caso zc=-1.58. Se encuentra dentro de la región de no rechazo. En este caso no se rechaza la hipótesis nula.
Ejercicio 20.
Hugger Polls afirma que un agente realiza una media de 53 entrevistas extensas a domicilio a la semana. Se introdujo un nuevo formulario para las entrevistas, y Hugger desea evaluar su eficacia. La cantidad de entrevistas extensas por semana de una muestra aleatoria de agentes es:
53 57 50 55 58 54 60 52 59 62 60 60 51 59 56
Con un nivel de significancia de 0.05, ¿puede concluir que la cantidad media de entrevistas de los agentes es más de 53 a la semana?
H0<= 53 H1>5353 57 50 55 58 54 60 52 59 62 60 60 51 59 56
Con un nivel de significancia de 0.05, ¿puede concluir que la cantidad media de entrevistas de los agentes es más de 53 a la semana?
Ya que el nivel de significancia de 0.05 se tiene que revisar en la tabla t student con un grado de libertad de 14, donde obtenemos 2.14, es decir si el valor de t calculado es menor a -2.14 la hipotesis nula se rechazara.
Encontramos el valor de la desviacion de la muestra y de la media de la muestra
obtenemos la media de la muestra
(53 + 57 + 50 + 55 + 58 + 54 + 60 + 52 + 59 + 62 + 60 + 60 + 51 + 59 + 56)/15
= 56.4
Despues la desviacion de la muestra se calcula siguiendo la regla de sumatoria de la raiz de ((Xi - 56.4)^2/14)=12.72
Obtenemos el valor de t donde tenemos que t=(x-μ)/(s/raiz(n-1))
por lo tanto t=(56.4-53)/(12.72/raiz(14)) siendo t= 1.000
Es decir nuestro 1 se encuentra dentro del intervalo donde se acepta H0,
por lo tanto la cantidad de entrevistas no es mayor a 53
jueves, 14 de mayo de 2015
Practica 3. Distribución Uniforme
La distribución o modelo uniforme puede considerarse como proveniente de un proceso de extracción aleatoria .El planteamiento radica en el hecho de que la probabilidad se distribuye uniformemente a lo largo de un intervalo . Así : dada una variable aleatoria continua, x , definida en el intervalo [a,b] de la recta real, diremos que x tiene una distribución uniforme en el intervalo [a,b] cuando su función de densidad para sea: para x Î [a,b].
De manera que la función de distribución resultará:
Su representación gráfica será :
Su representación gráfica será :
Su representación gráfica será :
Este modelo tiene la característica siguiente : Si calculamos la probabilidad del suceso
Tendremos:
Este resultado nos lleva a la conclusión de que la probabilidad de cualquier suceso depende únicamente de la amplitud del intervalo (D X) , y no de su posición en la recta real [a , b] . Lo que viene ha demostrar el reparto uniforme de la probabilidad a lo largo de todo el campo de actuación de la variable , lo que , por otra parte, caracteriza al modelo.
En cuanto a las ratios de la distribución tendremos que la media tiene la expresión:
La varianza tendrá la siguiente expresión:
de donde
por lo que
Ejemplo:
Ejemplo:
1.- Un reloj de manecillas se detuvo en un
punto que no sabemos. Determine la probabilidad de que se halla detenido en los
primeros 25 minutos luego de señalar la hora en punto.
Solucion:
Interalo [0,60]
F(x )= 1/(60-0) = 1/60
P(x) = P(0≤x≤25) = integral [0,25] 1/60 dx = 5/12
miércoles, 13 de mayo de 2015
Practica 3. Distribucion Hipergeometrica- Kassandra Castro
Hasta ahora hemos analizado distribuciones que modelizaban situaciones en las que se realizaban pruebas que entrañaban una dicotomía (proceso de Bernouilli) de manera que en cada experiencia la probabilidad de obtener cada uno de los dos posibles resultados se mantenía constante. Si el proceso consistía en una serie de extracciones o selecciones ello implicaba la reposición de cada extracción o selección , o bien la consideración de una población muy grande. Sin embargo si la población es pequeña y las extracciones no se remplazan las probabilidades no se mantendrán constantes . En ese caso las distribuciones anteriores no nos servirán para la modelizar la situación. La distribución hipergeométrica viene a cubrir esta necesidad de modelizar procesos de Bernouilli con probabilidades no constantes (sin reemplazamiento) .
Practica 3. Disribucion Binomial Negativa- Kassandra Castro
Esta distribución puede considerarse como una extensión o ampliación de la distribución geométrica . La distribución binomial negativa es un modelo adecuado para tratar aquellos procesos en los que se repite un determinado ensayo o prueba hasta conseguir un número determinado de resultados favorables (por vez primera) .Es por tanto de gran utilidad para aquellos muestreos que procedan de esta manera. Si el número de resultados favorables buscados fuera 1 estaríamos en el caso de la distribución geométrica . Está implicada también la existencia de una dicotomía de resultados posibles en cada prueba y la independencia de cada prueba o ensayo, o la reposición de los individuos muestreados
jueves, 7 de mayo de 2015
Practica 3. Ji- Cudrada- Clarisa Simental
La distribución Chi-Cuadrada (chi squared en inglés, se pronuncia “Kay Cuadrada skuerd”) es una de las distribuciones más empleadas en todos los campos. Su uso más común es cuando se quiere probar si unas mediciones que se hayan efectuado siguen una distribución esperada, por ejemplo la normal o cualquier otra. Otro de sus usos es en intervalos de confianza y pruebas de hipótesis para las varianzas o desviaciones estándar. Empezaremos ilustrando la definición de la distribución para proceder a ejemplos de uso práctico.
Supongamos que se efectúa el siguiente experimento estadístico.Seleccionamos una muestra aleatoria de tamaño n de una población con distribución normal, con desviación estandar igual a σ.
De la muestra encontramos que la desviación estandar es igual a s. Con estos datos podemos calcular una estadística, que llamamos Chi-Cuadrada Cuadrada, por medio de la siguiente ecuación:
La media es igual al número de grados de libertad libertad (que es igual al tamaño
de las muestras menos 1):
μ = ν = n – 1
•La varianza es igual a dos veces el número de grados de libertad libertad (por lo tanto la desviación estándar es la raíz cuadrada cuadrada de 2ν):
σ2 = 2 * ν
Ejemplo 1.
El espesor de un semiconductor se controla mediante la variación estándar no mayor a s=0.60 mm. Para mantener controlado el proceso se toman muestras aleatoriamente de tamaño de 20 unidades, y se considera que el sistema está fuera de control cuando la probabilidad de que s^2 tome valor mayor o igual al valor de la muestra observado es que es 0.01. Que se puede concluir si s=0.84mm?
Solución.
Existe fuera de control si
Entonces
Por tanto, el sistema está fuera de control.
Un farmacéutico Jefe del Dpto. Control de Calidad
en una industria alimenticia, descubre que en su proceso de producción el
contenido de ciclamato en su línea de mermeladas dietéticas varía en forma
indeseada. Sospechando que se trata de una falla en el dosificador, decide
tomar 10 muestras seguidas del mismo. Encuentra un promedio de 20 gramos con una
desviación de 8 gramos .
Si en su protocolo de fabricación la variación máxima permitida es del 3%,
determinar si el dosificador debe ser corregido.
El desviación estándar aceptable es: smáx = 3% de 20 g = 6 g . Luego:
H0:smáx ≤6 g.:
el dosificador funciona correctamente
H1:smáx > 6 g .: el dosificador debe ser
cambiado
Ejercicio excel.
Exisisten diferencias significativas en el estado nutricional entre hombres y mujeres?
Hipotesis Nula, Ho: Estado nutricional de los hombres es igual al de las mujeres.
Hipotesis Alternativa, Ha: El estado nutricional de los hombres no es igual al de las mujeres..
Nivel de confianza 95%, solo se rechaza Ho si el valor de p que resulte es menor de 0.05
Distribucion de frecuencias del IMC según sexo | |||
IMC | Hombre | Mujeres | Total |
Bajo peso | 33 | 78 | 111 |
Normal | 525 | 446 | 971 |
Obesidad | 155 | 333 | 488 |
Sobrepeso | 454 | 498 | 952 |
Total | 1167 | 1355 | 2522 |
En excel: Complementos- Stat Plus-Table Statics-selecciona las celdas sin lostotales- output-ok-cualquier celda no ocupada-ok.
miércoles, 6 de mayo de 2015
Practica 3. Distribución de Poisson-Clarisa Simental
Exposicion: https://docs.google.com/presentation/d/1PvUPnf8unUsVgZmn5LchXfht6eht1LBNJP5ItpU1D0g/pub?start=false&loop=false&delayms=3000
Existen fenómenos o experimentos en los que los eventos ocurren en intervalos continuos de tiempo o espacio (áreas y volúmenes), donde sólo importa la ocurrencia del fenómeno, ya que la no ocurrencia no tiene sentido. Por ejemplo, si en cierta región ocurren en promedio 2 terremotos por año, la variable aleatoria será el número de terremotos por año y es claro que no tiene sentido hablar del número de no terremotos por año. Lo mismo sucede para otros fenómenos, como el número de errores en una página, derrumbes anuales en una región montañosa, accidentes de tráfico diarios en cierto crucero, personas atendidas en un banco en un período de 10 minutos, partículas de polvo en cierto volumen de aire, nacimientos de niños en un periodo de tiempo, rayos que caen en una tormenta, llamadas que llegan a un conmutados telefónico en un minuto, insectos por planta en un cultivo, etc. También es de importancia mencionar que cada ocurrencia puede considerarse como un evento en un intervalo de tiempo determinado.
Existen fenómenos o experimentos en los que los eventos ocurren en intervalos continuos de tiempo o espacio (áreas y volúmenes), donde sólo importa la ocurrencia del fenómeno, ya que la no ocurrencia no tiene sentido. Por ejemplo, si en cierta región ocurren en promedio 2 terremotos por año, la variable aleatoria será el número de terremotos por año y es claro que no tiene sentido hablar del número de no terremotos por año. Lo mismo sucede para otros fenómenos, como el número de errores en una página, derrumbes anuales en una región montañosa, accidentes de tráfico diarios en cierto crucero, personas atendidas en un banco en un período de 10 minutos, partículas de polvo en cierto volumen de aire, nacimientos de niños en un periodo de tiempo, rayos que caen en una tormenta, llamadas que llegan a un conmutados telefónico en un minuto, insectos por planta en un cultivo, etc. También es de importancia mencionar que cada ocurrencia puede considerarse como un evento en un intervalo de tiempo determinado.
Formula.
x: es el número de ocurrencias del evento o fenómeno (la función nos da la probabilidad de que el evento suceda precisamente k veces).
λ: Es un parámetro positivo que representa el número de veces que se espera (esperanza) que ocurra el fenómeno durante un intervalo dado. Por ejemplo, si el suceso estudiado tiene lugar en promedio 4 veces por minuto y estamos interesados en la probabilidad de que ocurra k veces dentro de un intervalo de 10 minutos, usaremos un modelo de distribución de Poisson con λ = 10×4 = 40.
e: es la base de los logaritmos naturales (e = 2,71828...)
Ejemplo 1.
Suponga que hay 300 errores de impresión distribuidos aleatoriamente a lo largo de un libro de 500 paginas. Encuentre la probabilidad de que en una pagina dada contenga exactamente 2 errores de impresión.
Solución.
Excel.
Formula excel: =POISSON([x],[Esperanza λ],FALSO)
Ejemplo 2.
Solución Excel.
Formula excel: =POISSON([x],[Esperanza λ],FALSO)
Suscribirse a:
Entradas (Atom)