Kitabı oku: «Manual de estadística no paramétrica aplicada a los negocios», sayfa 2
Las consideraciones sobre el estadístico de prueba nos permiten evaluar la validez de H0 de acuerdo con el resultado proporcionado por una muestra. Siguiendo con nuestro ejemplo, tendríamos:
a) Si la proporción calculada en la muestra, p, es muy diferente o muy grande comparándola con la proporción poblacional π especificada en H0, se concluye que p no concuerda con π y H0 debe ser rechazada (se cuenta con evidencias muestrales suficientes para rechazar H0).
b) Por otro lado, si la proporción p de la muestra se diferencia en una cantidad muy pequeña de π, podríamos pensar que esa diferencia se debe al resultado de variaciones en el muestreo y que la proporción muestral p concuerda con H0, de modo que, ante tales evidencias, H0 no puede ser rechazada o no se cuenta con evidencias muestrales suficientes para rechazar H0.
En general, dada una muestra aleatoria, X1, X2, ..., Xn, un estadístico de prueba o de contraste, , es una función de los valores de la muestra, es decir, es una variable aleatoria cuya distribución muestral es conocida bajo el supuesto (a priori) de que la hipótesis nula H0: θ = θ0 es verdadera. De acuerdo con esta definición, puede determinarse un criterio o una regla de decisión para el rechazo o no rechazo de H0, respecto de los valores que puede tomar
y un resultado particular que podría obtenerse de la muestra.
2.4 Determinación del valor crítico
La distribución de muestreo del estadístico de prueba , generada bajo el supuesto de que H0 es verdadera, se divide en dos conjuntos excluyentes llamados regiones: una de ellas es la región de rechazo (conocida como la región crítica), que contiene los resultados menos favorables a H0, es decir, aquellos valores de
que se encuentran muy alejados de la afirmación establecida en H0, y su probabilidad de ocurrir es muy remota si H0 es verdadera. La probabilidad de ocurrencia de la región de rechazo es conocida precisamente como el nivel de significación α.
La otra es la región de no rechazo, que contiene los resultados más favorables a H0, es decir, aquellos valores de que se encuentran muy cercanos a la afirmación establecida en H0, y tienen por lo tanto alta probabilidad de ocurrir si H0 es verdadera. La probabilidad de ocurrencia de la región de no rechazo es conocida precisamente como el nivel de confianza 1 − α.
Estos dos conjuntos son separados por una línea divisoria determinada a partir del punto o valor crítico de la estadística de prueba, que se denota por c. Veremos más adelante que estas dos áreas, donde se puede ubicar el estadístico de prueba
, son muy importantes para tomar la decisión de rechazar o no rechazar H0.
El punto o valor crítico de la estadística de prueba, c, se calcula para un tamaño de muestra n fijo y un nivel de significación α específicos, y depende de la forma de la hipótesis alternativa H1, del tamaño del riesgo o el nivel de significación α y de la distribución de la estadística de prueba
.
Para cada uno de los tres tipos de pruebas antes mencionados, se tiene:
i) Prueba unilateral o de una cola
1. De cola izquierda
La región de rechazo, tal como se muestra en el gráfico 1.1, se encuentra en la cola izquierda de la distribución del estadístico de prueba , de manera que la validez de H0 se dará solo a partir de valores grandes
.
Gráfico 1.1 Región de rechazo en cola izquierda

Elaboración propia
Si, para un caso determinado, asumimos que la distribución del estadístico de prueba es la distribución t−student, y que la muestra es de tamaño n = 15 y el nivel de significación de la prueba lo fijamos en α = 0,05, tendremos que t(n-1; α) = t(14; 0,05) es el punto crítico y su valor es −1,761 (véase tabla A.31).
2. De cola derecha
La región de rechazo, tal como se muestra en el gráfico 1.2, se encuentra en la cola derecha de la distribución del estadístico de prueba , de manera que la validez de H0 se dará solo a partir de valores pequeños de
.
Si, para un caso determinado, asumimos que la distribución del estadístico de prueba es la distribución normal y el nivel de significación de la prueba lo fijamos en α = 0,05, tendremos que el punto crítico es Z1 − α = Z0,95 y su valor es 1,64 (véase tabla A.1).
Gráfico 1.2 Región de rechazo en cola derecha

Elaboración propia
ii) Prueba bilateral o de dos colas
La región de rechazo, como se muestra en el gráfico 1.3, se divide en dos partes iguales que corresponden a las dos colas de la distribución del estadístico de prueba , de manera que la validez de H0 se dará a partir de valores grandes y pequeños de
. En este caso, se observan dos puntos críticos.
Si, para un caso determinado, asumimos que la distribución del estadístico de prueba es la distribución normal y el nivel de significación de la prueba lo fijamos en α = 0,05, tendremos dos puntos críticos: Zα/2 = Z0,025 = −1,96 y Z1-α/2 = Z0,975 = 1,96 (véase tabla A.1).
Gráfico 1.3 Región de rechazo bilateral

Elaboración propia
2.5 Regla de decisión
La regla de decisión de una prueba o el contraste de hipótesis es el criterio que se establece o las condiciones que se formulan para decidir si una hipótesis nula H0 planteada en una investigación debe ser rechazada o no. La decisión finalmente es tomada sobre la base de la menor o la mayor probabilidad de ocurrencia de las evidencias muestrales observadas, bajo el supuesto de que H0 sea verdadera.
A continuación, se muestran dos maneras de plantear la regla de decisión a una prueba o un contraste de hipótesis:
i) El criterio del punto crítico
Como se mencionó en este documento, el punto o valor crítico de la estadística de prueba determina una línea divisoria entre las regiones de rechazo y no rechazo de H0, de modo que:
1. Región de rechazo de H0
Si el valor de la estadística de prueba se ubica en la región de rechazo, el criterio conduce a “rechazar la hipótesis nula”, lo que equivale a “aceptar la hipótesis alternativa”.
2. Región de no rechazo de H0
En caso contrario, si el valor de la estadística de prueba se ubica en la región de no rechazo, el criterio conduce a “no rechazar la hipótesis nula”, lo que equivale a mantenerla.
ii) El criterio del p-valor
Este criterio consiste en determinar la probabilidad de observar valores del estadístico de prueba, bajo el supuesto de que H0 sea verdadera, comparándolo luego con el valor de α. Actualmente, es muy usado en los software en las aplicaciones estadísticas.
El p-valor, llamado también valor de probabilidad, es la probabilidad de obtener un estadístico de prueba igual o más extremo que el obtenido de la muestra, bajo el supuesto de que H0 sea verdadera.
1. Si p-valor < α
El criterio conduce a “rechazar la hipótesis nula”.
2. Si p-valor ≥ α
El criterio conduce a “no rechazar la hipótesis nula”.
Gráfico 1.4 Probabilidad de obtener estadístico de prueba más extremo

Elaboración propia
En resumen, la decisión a la que conduce una prueba de hipótesis puede ser explicada de la siguiente manera:
– Si se rechaza H0, quiere decir que podemos afirmar, con una probabilidad α, que existen suficientes evidencias para no aceptar H0.
– Si no se rechaza H0, quiere decir que no tenemos evidencias muestrales suficientes para rechazarla.
3. TIPOS DE VARIABLES Y DATOS
3.1 Tipos de variables
La variable es una característica de la población a investigar y que toma diferentes valores.
Diagrama 1.1 Tipos de variables

Elaboración propia
i) Variable cuantitativa
Se refiere a características que se pueden registrar numéricamente, es decir, que se expresan mediante un número; por lo tanto, se pueden realizar operaciones aritméticas con ella. Podemos distinguir dos tipos:
1. Variables cuantitativas discretas
Son características que solo pueden adquirir valores enteros, y casi siempre hay “brechas” entre esos valores; por ejemplo, el número de personas que habitan en una casa (1, 2, 3, ..., etcétera).
2. Variables cuantitativas continuas
Son características que pueden tomar cualquier valor dentro de un intervalo específico. También se puede decir que son características cuya unidad de medida es fraccionaria; por ejemplo, el tiempo que toma volar de Lima a Nueva York, la altura (en cm) de los estudiantes.
ii) Variable cualitativa
Se refiere a características o cualidades que no pueden ser medidas con números, denominada también variable de atributo, y son características no numéricas de un estudio. Podemos distinguir dos tipos:
1. Variable cualitativa nominal
Son características que expresan un valor de nominación; por ejemplo, el sexo, la afiliación religiosa, el lugar de nacimiento, el color de los ojos.
2. Variable cualitativa ordinal
Son características que expresan un valor de orden; por ejemplo, el nivel de educación, el estrato socioeconómico, la categoría de ocupación.
3.2 Medición de las variables
Se entiende por medición al proceso mediante el cual se asigna un valor a la variable en un individuo en particular; este proceso sigue ciertas reglas determinadas previamente y utiliza las escalas que a continuación se indican:
i) Escala nominal
En esta escala, cada unidad de análisis pertenece o no a una de las categorías mutuamente excluyentes en las que se ha clasificado la variable; de manera que estas solo pueden ser iguales o diferentes. Las categorías pueden codificarse como números para diferenciarse entre ellas, pero no poseen el valor numérico correspondiente. Por ejemplo, la variable “sexo” tiene dos categorías: femenino y masculino, que podrían codificarse como 0 y 1 respectivamente. Asimismo, se tiene el caso de la variable “estado civil”, que tiene varias categorías tales como soltero, casado, viudo y divorciado, que podrían ser codificadas como 1, 2, 3, 4, respectivamente.
ii) Escala ordinal
En esta escala, al igual que en el caso anterior, para cada unidad de análisis se determina la pertenencia o no a una de las categorías excluyentes en las que se ha clasificado a la variable, y, adicionalmente, se establece una relación de orden de acuerdo con algún criterio; de manera que cada unidad elemental puede ser igual o diferente de otra y, asimismo, ser mayor o menor que ella. Las categorías también pueden codificarse como números, pero tampoco poseen valor numérico alguno. Así, por ejemplo, la variable “estrato socioeconómico”, que tiene varias categorías: A, B, C, D y E, las cuales también podrían ser codificadas en números, pero en este caso la categoría A ubica al individuo o la unidad de análisis en la categoría más alta (mayor jerarquía), mientras que la categoría E lo ubica en la categoría más baja (menor jerarquía).
Por otro lado, si tenemos el caso de la variable “opinión sobre el servicio brindado por un restaurante”, que también tiene varias categorías: malo, regular, bueno, muy bueno y excelente, esto implica un ordenamiento o una jerarquización de las categorías en las que se clasifica la variable.
iii) Escala de intervalo
En esta escala, a cada unidad de análisis se le asigna un valor numérico que indica la fuerza o la intensidad de la característica observada, pero el cero es relativo y no indica ausencia de esta. Es decir, se establece un orden sobre la base de una unidad de medida y un origen arbitrarios, de modo que la distancia entre cada uno de los valores puede ser determinada con exactitud (la longitud del intervalo entre dos valores es la misma, pero no se observa un cero verdadero). Cada unidad elemental puede ser igual, diferente, mayor o menor que otra, y es posible realizar operaciones de suma y resta entre ellas. Por ejemplo, la temperatura se mide en escala de intervalo, ya que la unidad de medida y el punto cero se tomaron de forma arbitraria; en este caso, el valor asignado mide la cantidad de calor y el cero no implica la ausencia de esta. El valor de la temperatura origen en grados Celsius es 0 °C, que es un cero relativo; la diferencia entre 5 °C y 10 °C y entre 25° y 30° es la misma; la temperatura entre 5 °C y 10 °C indica que la cantidad de calor ha aumentado, pero no implica que se haya duplicado.
iv) Escala de razón
En esta escala, a cada unidad de análisis también se le asigna un valor numérico que indica la fuerza o la intensidad de la característica observada, pero, en este caso, el cero es absoluto e indica ausencia de esta. Es decir, la unidad de medida y el origen son fijos, de modo que la razón entre los valores asignados a dos unidades elementales es independiente de la unidad de medida, con lo que se mantiene la igualdad de las proporciones. Cada unidad elemental puede ser igual, diferente, mayor o menor que otra, y es posible realizar operaciones de suma, resta y división entre ellas. Por ejemplo, en la variable “ingreso de los trabajadores”, si Juan percibe 6000 soles y Pedro, 2000 soles, se puede afirmar lo siguiente: un ingreso de 0 soles indica ausencia total de ingresos; Juan tiene mayor ingreso que Pedro; Juan tiene un ingreso de 4000 soles más que Pedro; Juan tiene el triple del ingreso de Pedro.
3.3 Tipos de datos
Las investigaciones cuantitativas de los negocios utilizan una serie de datos que están ligados a las escalas de medición que se indicaron líneas arriba y que podemos clasificar de acuerdo con su naturaleza, es decir, de acuerdo con el tipo de variable o característica de la unidad de análisis correspondiente, según lo cual pueden ser cualitativos o categóricos y cuantitativos o numéricos.
i) Datos cualitativos o categóricos
Se originan a partir de las variables que suelen expresarse en categorías, cada una de las cuales corresponde a un atributo de la unidad de análisis.
1. Datos nominales
El individuo o unidad de análisis es asignado solo a una de las categorías en las que se ha clasificado a la variable, y no existe un orden definido entre las categorías; sin embargo, es posible asignar códigos numéricos para cada una de dichas categorías. En el caso de que la variable tenga solo dos categorías, se dice que la misma es dicotómica, y en general se registra la ausencia (fracaso) o presencia (éxito) del atributo, por lo que resulta conveniente asignar los códigos 0 y 1, respectivamente.
2. Datos ordinales
El individuo o unidad de análisis es asignado solo a una de las categorías en las que se ha clasificado la variable, y es posible establecer un orden natural o lógico entre las categorías de la variable, lo que implica una especie de “jerarquía” entre dichas categorías. También en este caso es posible asignar códigos numéricos para cada una de las categorías establecidas.
Para el tratamiento estadístico de las variables cualitativas o categóricas que previamente han sido codificadas de forma numérica, debemos proceder con mucho cuidado, ya que los métodos que se tienen que utilizar en el análisis no deben considerar los datos como números, sino como categorías.
ii) Datos cuantitativos o numéricos
Se originan a partir de las variables que se expresan de forma numérica. En este caso, el dato es el resultado de la operación de conteo o medición de la característica en la unidad de análisis que por supuesto es un número, de modo que será posible realizar con ellos las operaciones aritméticas conocidas. Los datos cuantitativos o numéricos se clasifican en discretos y continuos.
1. Datos discretos
Se obtienen como resultado de realizar una operación de conteo en el individuo o unidad de análisis, lo que permite a la variable tomar un número contable (finito o infinito numerable) de valores.
2. Datos continuos
Se obtienen como resultado de realizar una operación de medición en el individuo o unidad de análisis, lo que permite a la variable tomar un número no contable (infinito no numerable) de valores en un rango determinado. Estos valores se expresan en alguna unidad de medida.
4. VENTAJAS DE LAS PRUEBAS NO PARAMÉTRICAS
Los procedimientos estadísticos clásicos, llamados también paramétricos, están diseñados para analizar variables cuantitativas, y tienen las siguientes características:
– Permiten contrastar hipótesis referidas a algún parámetro.
– Exigen el cumplimiento de determinados supuestos sobre las poblaciones originales de las que se extraen los datos.
– Analizan los datos obtenidos con una escala de medida de intervalo o razón.
En aquellos casos donde no se cumplen los requerimientos señalados, existen como alternativa otros procedimientos que están enmarcados en la estadística no paramétrica, los cuales permiten al investigador realizar el análisis de los datos con mayor flexibilidad, obtener resultados más consistentes y enriquecer la investigación por el hecho de ser factible la aplicación de la inferencia estadística.
Por lo tanto, se puede afirmar que las pruebas no paramétricas tienen las siguientes ventajas:
– No requieren el cumplimiento del ajuste de los datos a distribuciones teóricas.
– Pueden aplicarse en la mayoría de los casos donde comúnmente se usan las pruebas paramétricas.
– Tienen la facilidad en su desarrollo y comprensión complementada con el hecho de que, en la actualidad, la parte operativa se puede desarrollar con el apoyo de software estadístico.
Capítulo2 | Caso de una muestra |
En este capítulo presentamos la aplicación de las pruebas estadísticas no paramétricas cuando se tiene una muestra de observaciones de una variable cualitativa. Es decir, nos centraremos en las pruebas binomial, ji-cuadrado, Kolmogorov-Smirnov y de rachas.
1. PRUEBA BINOMIAL
Esta prueba permite comparar las frecuencias observadas de una muestra respecto a las frecuencias esperadas de una población cuya variable es dicotómica o que tiene dos valores posibles. Es decir, es una prueba basada en la distribución binomial que hace posible obtener una estimación de la probabilidad de que las observaciones de una muestra que corresponden al grupo 1 (grupo de interés) sea similar a la de población de donde proviene la muestra.
1.1 Procedimiento de la prueba binomial
i) En primer lugar
Se extrae una muestra aleatoria de observaciones independientes x1, x2, …, xn que pueden tomar valores de cualquiera de las dos categorías de la variable de estudio, cuya probabilidad de la categoría de interés es p.
ii) En segundo lugar
Se obtiene la frecuencia de las observaciones que corresponden a la categoría de interés, la misma que se supone que debe ajustarse a una distribución binomial; esto es,
1.2 Dócima de hipótesis de la prueba binomial
i) Hipótesis por plantear
H0 : La proporción de observaciones que corresponden a la categoría de interés es igual a p0.
H0 : p = p0
H1 : La proporción de observaciones que corresponden a la categoría de interés es menor que o mayor que o diferente que p0.
H1 : p < p0 o
H1 : p > p0 o
H1 : p ≠ p0
ii) Fijar el nivel de significación
El nivel de significación es la máxima probabilidad de cometer error tipo I y se denota como α, para 0 ≤ α ≤ 0,10.
iii) Estadístico de prueba
El valor del estadístico de prueba es la frecuencia de observaciones que corresponden a la categoría de interés; esto es,
iv) Regla de decisión
Si X es la variable de estudio, se puede afirmar que X ~ B(n; p0), por lo tanto se rechaza H0 si p − valor < α, teniendo en cuenta que:
1. Si H1 : p < p0,
2. Si H1 : p > p0,
3. Si H1 : p ≠ p0,
También se puede usar la tabla A.9 para este propósito.
Cuando n > 20, tomando en consideración el teorema central del límite, se pueden usar las siguientes aproximaciones:


1.3 Caso de aplicación de la prueba binomial
De acuerdo con el estudio de opinión realizado por Ipsos Apoyo Opinión y Mercado S. A., en exclusividad para el diario El Comercio y los suscriptores de Opinión Data1, entre los días 13 y 14 de agosto del 2013 a 1200 personas mayores de 18 años residentes de las 16 principales ciudades del país, se obtuvo el siguiente reporte:
Tabla 2.1 Opinión sobre aprobación de la gestión del presidente Ollanta Humala
Respuesta | Entrevistados |
Aprueba | 348 |
Desaprueba | 744 |
No precisa | 108 |
Total | 1308 |
Elaboración propia con base en los resultados de la Encuesta Urbana efectuada por Ipsos Apoyo Opinión y Mercado S. A., entre los días 13 y 14 de agosto del 2013.
El propósito es sustentar que el nivel de aprobación del presidente Ollanta Humala en el mes de agosto del 2013 estuvo por debajo del 30 %.
i) Desarrollo del caso
La muestra aleatoria corresponde a 1200 personas mayores de 18 años, que puede considerarse como una muestra de observaciones independientes. La variable de estudio es “opinión respecto a la aprobación de la gestión del presidente Ollanta Humala”, cuya categoría de interés es la respuesta “aprueba” y el valor de la probabilidad a contrastar es p = 0,30.
1. Hipótesis
H0 : El nivel de aprobación del presidente Ollanta Humala en el mes de agosto del 2013 no estuvo por debajo del 30 %.
H0 : p = 0,30
H1 : El nivel de aprobación del presidente Ollanta Humala en el mes de agosto del 2013 estuvo por debajo del 30 %.
H1 : p < 0,30
2. Nivel de significación
Se asume un nivel de significación del 5 %, esto es, α = 0,05.
3. Estadístico de prueba
El valor del estadístico de prueba es la frecuencia de las observaciones que corresponden a la categoría de interés, esto es, t = 348.
Entonces, el p − valor está dado por:

4. Regla de decisión
Si X es la variable de estudio, se puede afirmar que X ~ B(n; p0); por lo tanto, se rechaza H0 si p − valor < α.
5. Decisión
Dado que p − valor > α, entonces no se rechaza H0.
ii) Uso de software
En este caso se hace uso del IBM® SPSS® Statistics, versión 25, y el procedimiento es el siguiente:
1. Ingreso de los datos

2. Ponderación de los casos
Datos Ponderar casos …

3. Efectuar la corrida
Analizar Pruebas no paramétricas
Cuadros de diálogo antiguos
Binomial

4. Resultados

iii) Conclusión
Dado que el p-valor = sig. exacta (unilateral) = 0,23502, H0 no se rechaza. Por lo tanto, el nivel de aprobación del presidente Ollanta Humala en el mes de agosto del 2013 no estuvo por debajo del 30 %.
2. PRUEBA JI-CUADRADO
Entre su gran variedad de aplicaciones, la distribución ji-cuadrado se emplea para hacer contrastes entre frecuencias observadas y esperadas. Por ejemplo, si de cada 100 recién nacidos se espera que 50 sean varones y observamos que en realidad 40 son varones, entonces sería de interés conocer la “bondad de ajuste” entre lo observado y lo esperado. La gran pregunta que surge a partir de este planteamiento es si las diferencias entre los valores observados y sus correspondientes valores esperados se dan como resultado del azar o se debe a otros factores, es decir, qué tan grande tiene que ser esta diferencia para que se pueda concluir que existen otros factores distintos del azar que causan esta diferencia.
La prueba ji-cuadrado también suele usarse para determinar si una distribución de probabilidad, por ejemplo, binomial, Poisson, exponencial, normal, etc., es la adecuada para representar la distribución de los datos de la muestra que se tenga que analizar y, a partir de ella, se puedan hacer inferencias válidas que permitan tomar decisiones confiables.
En síntesis, la prueba ji-cuadrado permite verificar si existe diferencia significativa entre la distribución de frecuencias observadas Oi y la distribución de frecuencias esperadas Ei. Es decir, su hipótesis nula plantea que la distribución de las frecuencias observadas de una muestra se ajusta a las frecuencias esperadas de distribuciones como la normal, Poisson, binomial, uniforme, entre otras.
2.1 Procedimiento de la prueba ji-cuadrado
i) En primer lugar
Se elabora una tabla de frecuencia de los datos de una muestra, cuya variable puede ser cualitativa o cuantitativa.
Tabla 2.2 Estructura para el registro de los datos para la prueba ji-cuadrado

Elaboración propia
ii) En segundo lugar
Se determinan las probabilidades de ocurrencia P(Ai) de cada una de las categorías Ai, de acuerdo con la distribución de probabilidades con la que se quiere probar la bondad de ajuste de las frecuencias observadas de la muestra. Esto es, si el ajuste corresponde a:
1. Distribución uniforme

2. Distribución de Poisson
Es necesario estimar , luego se puede obtener:

3. Distribución binomial
Es necesario hallar el valor de para estimar el valor de
. De este modo, se puede obtener:

4. Distribución normal
Es necesario estimar μ y σ mediante:

Luego, mediante el uso de la tabla A.1, obtener:

iii) En tercer lugar
Se obtienen las frecuencias esperadas de cada una de las categorías mediante: Ei = n * P(Ai) ∀ i = 1, …, r.
2.2. Dócima de hipótesis de la prueba ji-cuadrado
i) Hipótesis por plantear
H0 : Las frecuencias observadas de una muestra se ajustan a las frecuencias esperadas de la distribución propuesta.
H1 : Las frecuencias observadas de una muestra no se ajustan a las frecuencias esperadas de una distribución diferente de la propuesta.
ii) Fijar el nivel de significación
El nivel de significación es la máxima probabilidad de cometer error tipo I, y se denota como α para 0 ≤ α ≤ 0,10.
iii) Estadístico de prueba
El valor del estadístico de prueba se calcula mediante la siguiente expresión:

iv) Valor crítico
El valor crítico para el contraste se obtiene de la tabla A.2 que se muestra en los anexos adjuntos. Los grados de libertad están determinados por: gl = k − v − 1, siendo v el número de parámetros estimados de la distribución a probar; por ejemplo, si el ajuste es a una:
1. Distribución uniforme: v = 0.
2. Distribución binomial o Poisson: v = 1.
3. Distribución normal: v = 2.
v) Regla de decisión
Se toma la decisión de rechazar o no rechazar la hipótesis nula, de acuerdo con la siguiente regla de decisión:
H0 se rechaza si y solo si: ; en caso contrario, no se rechaza.
2.3 Caso de aplicación de la prueba ji-cuadrado
i) Caso de bondad de ajuste a una distribución con parámetros conocidos
El gerente de una cadena de supermercados, que tiene cinco sucursales (Camacho, San Isidro, Miraflores, San Miguel y San Borja), ha implementado un cambio de imagen en cada una de ellas con el propósito de brindar más comodidad a sus clientes. Antes de dicho cambio, tenía el conocimiento de que la distribución de sus clientes en cada sucursal era la siguiente: 10 % de sus clientes de la sucursal Camacho, 25 % de San Isidro, 20 % de Miraflores, 30 % de San Miguel y 15 % de San Borja. Para evaluar el efecto del cambio de imagen, se seleccionó una muestra aleatoria de clientes durante el último fin de semana, y se registró la asistencia de dichos clientes a las sucursales, cuya distribución se muestra en la siguiente tabla:
Tabla 2.3 Distribución de clientes según sucursal
Sucursales | Clientes |
Camacho | 22 |
San Isidro | 44 |
Miraflores | 46 |
San Miguel | 62 |
San Borja | 26 |
Total | 200 |
Elaboración propia
En este caso, el objetivo es comprobar que la distribución de clientes no es la misma después del cambio de imagen. Es decir, comprobar si el cambio de imagen ha modificado la distribución de sus clientes en cada sucursal.
ii) Desarrollo del caso
En el siguiente reporte, se presenta el detalle del cálculo de las frecuencias esperadas y del valor del estadístico de prueba:
Tabla 2.4 Resultados de la aplicación de prueba ji-cuadrado

Elaboración propia
Con base a este reporte, el valor del estadístico de prueba es:

1. Hipótesis
H0 : La distribución de clientes no es diferente después del cambio de imagen.
H1 : La distribución de clientes es diferente después del cambio de imagen.
2. Nivel de significación
Se asume un nivel de significación del 5 %, esto es, α = 0,05.
3. Estadístico de prueba:

4. Valor crítico
En este caso, el valor crítico es , dado que k = 5 y entonces gl = 4, valor que se ha obtenido de la tabla A.2. Cabe mencionar que v = 0, porque el ajuste es para una distribución con parámetros conocidos.
5. Regla de decisión
H0 se rechaza si y solo si: ; en caso contrario, no se rechaza.
6. Decisión
Dado que , entonces no se rechaza H0.
iii) Uso de software
En este caso se hace uso del Minitab® 18, y el procedimiento es el siguiente:
1. Ingreso de los datos

2. Efectuar la corrida
Stat Tables
Ji-Square Goodness-of-Fit Test (One Variable)…

3. Resultados

iv) Conclusión
Como el p - valor = 0,659, H0 no se rechaza. Entonces, se comprueba que la distribución de clientes no es diferente después del cambio de imagen. Es decir, el cambio de imagen no ha modificado la distribución de sus clientes en cada sucursal.
Ücretsiz ön izlemeyi tamamladınız.