Kitabı oku: «ESTADÍSTICA APLICADA A PSICOLOGÍA Y EDUCACIÓN.», sayfa 3

Yazı tipi:

De los siguientes enunciados, clasifique como continuo o discreto:

i. Cantidad de mujeres en la clase

ii. Número de veces que el ratón en una caja de Skinner presiona la palanca

iii. Edad de los participantes en un experimento

iv. Cantidad de palabras recordadas

v. Peso de los alimentos a ingerir

vi. Porcentaje de estudiantes en clase mayores a 20 años

De los siguientes enunciados, clasifique como nominal u ordinal:

i. Cantidad de bicicletas utilizadas por los alumnos

ii. Tipo de bicicletas utilizadas por los alumnos

iii. Dominio de la materia de Estadística entre los estudiantes en categorías de deficiente, regular y bueno

iv Ansiedad de hablar en público en una escala entre 1 y 100

CAPÍTULO 2: ESTADÍSTICA DESCRIPTIVA

El uso que debe darse a la Estadística Descriptiva dentro de la Psicología y Educación es de suma importancia debido a su aplicación directa en medición de variables del comportamiento humano, La Figura 3 hace referencia a la implicación de los distintos temas descriptivos con algunas áreas dentro de la Psicología


Figura 3: relación de la estadística con la psicología (Rodríguez Monterrosa, n.d.)


Lo que se presenta en este cuadro es un buen resumen de lo que se ha desarrollado en las páginas anteriores, es clara la importancia de la observación, de la identificación del tipo de variable a estudiar, de la división general de la Estadística en Descriptiva e Inferencial, de los pasos lógicos que la Matemática exige: recolectar, ordenar, analizar y presentar los resultados tanto de manera analítica como gráfica y por último la aplicación a las distintas áreas dentro de la Psicología; aunque este cuadro-resumen no hace referencia a la aplicación en ciencias sociales en general ni en educación en particular, lo que se ha venido tratando en este libro bien se puede incluir sin afectar su esencia.

Procederemos entonces al estudio de cada una las dos grandes áreas en las que se divide la Estadística, iniciando con los temas referentes a la Descriptiva.

ESTADÍSTICA DESCRIPTIVA

La Estadística Descriptiva utiliza algunas herramientas de análisis que permiten obtener una visión general de la variable a estudiar, como su nombre lo indica trata de describir el comportamiento del objeto de estudio en base a varias medidas que permitirán tomar decisiones sobre lo estudiado.

En la Figura 4 se resume las partes en las que esta rama de la Estadística se divide y que las estaré tratando en las siguientes páginas.



Figura 4: división de la estadística descriptiva

MEDIDAS DE TENDENCIA CENTRAL

Estas medidas ayudan a “percibir” y hasta “intuir” alrededor de qué números se aglutinan los valores obtenidos en la muestra estudiada (y supondríamos también en su población), es decir son los resultados que pueden tomarse como representantes del “estado” de la variable y sobre ellos determinar el comportamiento de la esta y describir sus características.

Aunque estos datos nos dan una primera idea sobre el objeto de estudio, representan al mismo tiempo una visión algo “miope” en la evaluación que podemos tener de la muestra en particular y de la población en general, pero aun así estas medidas son muy utilizadas para dar una apreciación sobre el objeto de estudio (variable), aunque a mi juicio erróneamente si el análisis solo se basa en ellas.

Las medidas de Tendencia Central son tres: Media (promedio), Mediana y Moda; como casos especiales de la Media también se estudian otros tipos como son: Media Geométrica (utilizada para fines que salen del alcance de este libro, como son temas referentes a progresiones geométricas y de análisis financiero), Media Acotada y Media Ponderada (sobre estas dos últimas trataré en páginas posteriores).

Media (promedio)

Es la medida más utilizada en los análisis estadísticos y se la obtiene de la sumatoria de todos los datos numéricos de la muestra dividida entre el tamaño de la misma.

Característica principal: se ve afectada por valores extremos, esta afectación puede distorsionar mucho su interpretación.

Por ejemplo, si tenemos los siguientes datos:

1 1 3 5 9 11

La Media de estos valores es: 5

Pero si hacemos solo un cambio en uno de los extremos, suponiendo por ejemplo que hubo un error de digitación y faltó incluir un dato (digamos 100) entonces la muestra pasa a ser la siguiente:

1 1 3 5 9 11 100

Con este cambio, la Media pasa a ser: 18.57; como se puede notar, un valor extremo como el 100 hizo que el promedio se vea aumentado en casi cuatro veces.

Muchas críticas y hasta bromas se producen debido a esta particularidad del promedio, cito la siguiente frase de Nicanor Parra (Poeta, Matemático y Físico chileno): “Hay dos panes. Usted se come dos. Yo ninguno. Consumo promedio: un pan por persona.”

Es por esto que, al utilizar solo el valor de la Media como indicador del comportamiento de alguna variable, debe tenerse mucho cuidado al tomar decisiones en base a ella, se recomienda entonces verificar si los datos se distribuyen más o menos equitativamente alrededor del valor encontrado, sobre esto trataremos más adelante.

Mediana

Esta medida conceptualmente divide en dos partes exactamente iguales a la muestra, por tanto, indica que tomando en cuenta este dato, el 50% de la muestra tendrá valores inferiores y el otro 50% valores superiores al valor encontrado.

En el caso de esta medida, es importante señalar que los datos deben estar ordenados (preferiblemente en forma ascendente); además, para su cálculo existen dos posibilidades según el número de datos, es decir si la muestra está compuesta por un número par o impar de elementos.

Si ocurre que hay un número impar de elementos, la Mediana será simplemente aquel valor que se encuentra exactamente en la mitad (recuerde los datos deben estar ordenados, si es en Excel esto no hará falta) y para el caso contrario (número par de datos) se deberá hacer un promedio entre los dos datos centrales.

A diferencia de la Media, la Mediana se afecta muy pocas veces por valores extremos de la variable, y cuando lo hace, su valor no cambia tanto como la Media, por ello se dice que es la medida de tendencia central más estable.

Si utilizamos el ejemplo propuesto anteriormente para la Media:

1 1 3 5 9 11

En este ejemplo hay seis datos, por lo tanto, hay que obtener el promedio de los valores centrales (el 3 y el 5) por tanto la Mediana será 4

Y si de igual manera aumentamos el valor de 100, los datos se transforman en esta secuencia:

1 1 3 5 9 11 100

Y la Mediana será ahora 5 dado que es el valor central; como se puede notar, el haber aumentado un valor extremo no afectó mayormente el valor inicial, en este caso pasó de un valor inicial de 4 al nuevo valor: 5.

Pero el estudio de la Mediana en realidad no debe hacerse de una manera tan simple como la expuesta, aunque lastimosamente esto es lo que normalmente ocurre. ¿Cuál es entonces la propuesta para analizar los datos con esta medida? Voy a poner un ejemplo para establecer que la Mediana no debe interpretarse solo como un valor que divide a la muestra en dos partes iguales.

La variable a analizar es el rendimiento de la materia de Matemática en segundo curso de básica de un determinado centro educativo a través de las notas publicadas para tres paralelos distintos:


Paralelo 1Paralelo 2
Paralelo 3


El valor de la Mediana para los tres casos es el mismo: 5.5. De acuerdo al concepto revisado se diría entonces que en los tres casos el 50% de las notas de Matemática están por debajo de 5.5 y el otro 50% está por encima de esa nota y nada más.

Visto así los tres paralelos tendrían la misma problemática. Pero pongamos “una lupa” a los datos de cada grupo.

Si ordenamos los datos de menor a mayor se podrá apreciar lo siguiente:

Primer grupo: las notas están “repartidas” desde el 1 hasta el 9, es decir hay notas muy variadas

Segundo grupo: la concentración de notas se distribuye entre dos extremos: [1 y 2] y [8 y 9], con tan solo dos notas intermedias: un 5 y un 6

Tercer grupo: Las notas están repartidas entre el 4 y el 7, es decir no hay notas a ninguno de los dos extremos mínimo y máximo.

Tratando de graficar esto, podríamos ver lo siguiente:

Primer grupo




Segundo grupo




Tercer grupo



La gran diferencia entonces entre el segundo y tercer grupo es la dispersión de las notas (este tema lo trataremos en otro capítulo), en el segundo grupo los valores están repartidos hacia los extremos y eso significa que hay grandes diferencias de aprovechamiento entre los alumnos; en cambio en el tercer grupo, las notas se concentran en los valores medios (entre 5 y 7) sin que haya mucha diferencia en las notas; en dos palabras esto significa que la distribución en el segundo grupo es muy heterogénea y en el tercero es homogénea.

Si este análisis no se hace con los valores de la Mediana, ésta no dará un valor agregado a la variable analizada ya que como se ve en los ejemplos un mismo valor (5.5) de la Mediana para los tres grupos no discrimina la situación de cada grupo.

Moda

Esta medida indica que existe una mayor cantidad – no necesariamente la mayoría – de elementos de la muestra con este valor.

No es posible aplicar métodos matemáticos para estudiar la Moda, además, si hay varios valores (más de dos) de igual “peso” (es decir tienen la misma frecuencia), la importancia de la Moda como medida descriptiva pasa a ser nula ya que no puede utilizarse un valor sobre otro como representante de la muestra.

Puede darse el caso de tener dos valores modales, pero si hay más se dice que no existe Moda; en este caso se deben tomar en cuenta algunas consideraciones en el estudio de la variable. Al encontrar un valor Modal, se debe tener cuidado en su interpretación ya que este puede no ser representativo en realidad.

Utilizando el ejemplo que hemos venido trabajando

1 1 3 5 9 11

En este caso el único valor que se repite es el uno, por tanto, sería el valor Modal, pero ¿consideraría usted que este dato (uno) es un buen representante de la muestra estudiada?, es decir los valores que toma la variable ¿tienden a estar alrededor del uno? Parecería que no.

RELACIÓN ENTRE LAS TRES MEDIDAS DE TENDENCIA CENTRAL

En cuanto a la relación de las tres medidas de tendencia central, es más frecuente que, entre ellas, la Media y Mediana sean valores cercanos entre sí (no es que deba ocurrir), la Moda no necesariamente, en el ejemplo estudiado ocurre esto:

Media (x̅) = 5

Mediana (Md) = 4

Moda (Mo) = 1

Respecto a lo que manifestaba líneas atrás sobre la posible “miopía” de las medidas de tendencia central, con el siguiente ejemplo trataré de demostrar esto.

Supongamos que en un centro educativo se dan las siguientes condiciones al mismo tiempo en dos paralelos distintos (asunto que es muy probable que ocurra):

Materia: Química

Nivel: segundo de bachillerato

Paralelos: A y B

Profesor: el mismo para ambos grupos

Promedio de la materia en ambos paralelos: 6.52 (se califica sobre 10 puntos)

Condiciones de aprendizaje para los dos grupos: horarios similares, igual número de estudiantes, mismo número de horas por semana, iguales condiciones ambientales dentro y fuera del aula, los estudiantes son antiguos para la institución.

Tipo de variable: cuantitativa continua

¿Cuál sería entonces la conclusión lógica? Pues no otra que tomar las mismas medidas pedagógicas para mejorar el promedio en ambos paralelos y reforzar los conocimientos.

Visto así el presente caso, el psicólogo educativo o cualquier pedagogo habrán tomado una decisión de proponer métodos de aprendizaje y refuerzo, dinámicas y acercamientos con las mismas características para los dos grupos.

¿Es esto correcto? Al parecer en principio sí, pero veamos lo siguiente:

Notas (en orden ascendente) de los paralelos A y B en la materia señalada:




Si calculamos el promedio de cada grupo nos da exactamente 6.52381 ¡para ambos casos! Y en cuanto a la Mediana y Moda los valores son:

Paralelo A: Mediana: 9; Moda: 10

Paralelo B: Mediana: 6; Moda: 6

Luego de conocer los datos de cada grupo, ¿tomaría usted entonces las mismas medidas pedagógicas y psicológicas para estos grupos? Si su respuesta es afirmativa le sugiero se mantenga expectante ya que más adelante volveré con el ejemplo para analizar con otros valores estadísticos que puedan dar luces sobre una decisión final.

Sin embargo de tener mucha información respecto a la situación de los grupos estudiados, la “miopía” que aún existe y no nos permite ver mejor las cosas está dada por una razón básica: no conocemos otras medidas que permitan quitar el velo y así ofrecer mejores conclusiones y recomendaciones.

Por lo pronto al estudiar cualquier variable se recomienda hacerlo no solo con los valores de las medidas de tendencia central, si no dando un vistazo general a todos los datos ordenándolos de menor a mayor; en este caso el gráfico de las notas de los dos paralelos se vería así:




Fíjese la “repartición” de los números, es notorio que en el paralelo “B” hay un “peso” o distribución hacia notas mayores a cinco y en el paralelo “A” hay un “equilibrio” en cuanto a la repartición (distribución) de notas.

Para iniciar el desarrollo de los ejercicios, paso a indicar la forma de calcular las medidas de tendencia central en Excel en lo que se conoce como datos simples, en este caso desarrollaré el proceso con los datos del paralelo A del ejemplo.

Excel calcula los valores de las medidas de tendencia central sin importar ni el orden de los datos ni la forma de presentación de los mismos, es decir los datos pueden presentarse en una sola columna o fila o en una matriz.

Se debe aclarar también que hay varias formas de realizar los cálculos, aquí presentaré algunas de ellas para ir familiarizándonos con los procesos.




Colóquese en alguna celda vacía y en el menú principal al final de la pestaña “Inicio” encontrará el símbolo “Σ Autosuma” y una flecha hacia abajo, allí hay varias funciones, escoja “Promedio” resalte todos los datos y aplaste la tecla “enter”. Habrá encontrado el valor: 6,52380952.

Para el cálculo de la Mediana escoja otra celda vacía y haga “click” en fx que se encuentra sobre la letra “D” correspondiente a los nombres de las columnas, el cuadro de diálogo se presenta en la Figura 5:



Figura 5: cuadro de diálogo para buscar la función mediana

NOTA: Lo que se vea en el cuadro de diálogo que se presente no tendrá por qué coincidir con lo que he presentado en la Figura 5



Figura 6: cuadro de diálogo donde se aprecia la función mediana para su cálculo

Haga click en el campo donde dice “Usadas recientemente” y cambie a la categoría “Todo”, allí busque la función: “Mediana” y acepte, la Figura 6 a continuación deberá ser lo que encuentre luego de esta acción.



Figura 7 : cuadro de diálogo que permite escoger los valores para calcular la mediana

Luego de aceptar (mediante un click en “Aceptar” o dando “enter”), encontrará un cuadro de diálogo como el que se presenta en la Figura 7:



Figura 7: cuadro de diálogo que permite escoger los valores para calcular la mediana

Resalte los datos del ejercicio y acepte, habrá obtenido 9

Para el cálculo de la Moda siga los mismos pasos anteriores buscando la función “Moda” (hay varias opciones, escoja solo la que dice “Moda”), habrá encontrado el valor 10.

EJERCICIOS DE APLICACIÓN DEL CAPÍTULO

Ejemplo 1

Los siguientes datos se refieren al tiempo (en segundos) que un grupo de personas se demoró en reaccionar a un estímulo externo. Determine la variable, encuentre las tres medidas de tendencia central, observe, comente, concluya y recomiende.




Antes de seguir adelante con el ejercicio, quisiera aclarar lo que a mi juicio debe tomarse en cuenta al analizar un caso, y es el tema de: Observar, Comentar, Concluir y Recomendar.

Estos cuatro momentos del análisis se diferencian por el nivel de complejidad, a saber:

Observar: es el estado en el que el investigador da una rápida mirada a los datos, podría decirse que “entramos fríos al análisis” y trata de darse una idea de la situación de la variable, en este punto debe tener ya una idea del comportamiento de la variable.

Comentar: es lo que yo llamaría un nivel primario, ya que luego de observar podemos decir ciertas cosas muy generales sobre los datos en función de la variable de estudio, ya hemos “calentado” para seguir con el proceso.

Concluir: luego de procesar los datos, encontrar los estadísticos correspondientes, realizar gráficos, comparar con parámetros (si los hay específicamente o por conocimiento previo de la variable) y estudiar los resultados; podríamos decir que esta etapa significa estar ya en plena actividad dentro del análisis, podemos dar nuestro “veredicto” del problema estudiado.

Recomendar: Esta última etapa es la más importante y seguramente puede asegurarse es la razón de ser del estudio, ya que en ella se cumple con el objetivo general de la investigación, es decir, contestar el para qué se investigó. Aquí el investigador debe dar su punto de vista, por ejemplo, para solucionar el problema, dar una guía para otros casos o establecer condiciones para un futuro.

Tanto la conclusión como la recomendación deben sustentarse en los resultados encontrados

Volvamos al caso entonces.

¿Por qué es importante determinar la variable?

Recordemos que la variable es el objeto de estudio y para poder concluir o recomendar es fundamental que tengamos claro a qué se refieren los datos.

La variable en este caso sería: “reacción ante un estímulo externo medido en segundos” es decir lo que interesa medir es el tiempo de respuesta y con ello se espera concluir algo sobre el grupo de estudio y obviamente recomendar en base a los resultados.

¿Qué puede decir observando los datos? ¿Puede ya comentar algo?

Los datos ya están ordenados de menor a mayor aunque para cálculos en Excel no hace falta que esto ocurra.

Observaciones directas:

Número de datos: 40

Valor mínimo: 0.1 segundos

Valor máximo: 9.56 segundos

Primeros cálculos:

Media: 2.8753

Mediana: 2.125

Moda: 1.93

Comentario: las personas reaccionan de manera distinta ante situaciones similares.

Primera propuesta de conclusión dada por alguna persona: “el grupo es muy lento para reaccionar”, esto no significa que usted esté de acuerdo con lo expresado.

En la conclusión usted puede decir lo que a su juicio le parezca, pero cualquiera que esta sea, debe tener un sustento numérico del cual apoyarse, en este caso basado en su forma de pensar ya que no hay parámetros.

En este caso a esta persona le parece que el grupo es lento y puede apoyarse diciendo que dado el valor del promedio de reacción ante el estímulo externo (2.87 segundos),este es un tiempo muy largo, además de existir en el grupo muchos datos (son 16 de 40) que indican ser superiores a las medidas de tendencia central.

Segunda propuesta de conclusión: “el grupo reacciona en un tiempo normal”

En este caso a la persona le parece que entre 1.93 segundos (Moda, valor más bajo) y 2.87 segundos (Media valor más alto), es normal que se reaccione dado que el tiempo es corto y no hay mucha diferencia en las medidas representativas.

Tercera propuesta de conclusión: “el grupo en general reacciona de manera muy rápida ante el estímulo externo”.

En este caso la persona considera que como tan solo son 2 segundos y centésimas (tomando en cuenta Media o Mediana) ese tiempo significa mucha rapidez de reacción; además hay 15 personas que reaccionaron en menos de 1.93 segundos que es el valor más bajo en tiempo de reacción.

¿Cuál es la conclusión válida? Puede decirse que las tres tienen sus razones justificadas o ninguna de ellas (y de pronto puede haber otras); ante eso no se puede discutir dado que cada persona tendrá una forma de ver las cosas estemos o no de acuerdo.

¿Cuál es el problema en este ejercicio? ¡Faltan datos!, pues sí, ya que no sabemos por ejemplo de qué estímulo externo estamos hablando o las edades de esas personas o las características del grupo estudiado, entre otros; por tanto, cualquier conclusión es discutible.

Respecto a la recomendación, esto depende de la conclusión a la que haya llegado el investigador.

En el caso de las tres conclusiones podría decirse lo siguiente:

Recomendación 1: “realizar ejercicios de motricidad con el grupo para estimular la capacidad de reacción”

Recomendación 2: “no hacer nada con el grupo ya que los tiempos son lo esperado”

Recomendación 3: “ayudar a los miembros del grupo a que tengan mayor control de sus reacciones”.

Lo que debe ocurrir entonces es que no haya contradicción entre la conclusión y la recomendación ya que la segunda depende del criterio emitido en la primera.

Pero los análisis generalmente no se hacen con los datos tal cual nos llegan, especialmente en Psicología y procesos pedagógicos, he recomendado siempre que a los datos de la variable se los trabaje haciendo grupos. ¿Por qué? Porque en el comportamiento humano muchas veces se establecen diferencias que deben tratarse entre personas con una misma afinidad o característica lo más cercana posible.

Por ejemplo, en el caso que estamos tratando, el tiempo de reacción entre el más “rápido” (0.1 segundos) y el más “lento” (9.56 segundos) es demasiado amplio, ya que, sin importar (por lo pronto) el tipo de estímulo, la diferencia es significativa.

Este hecho de que existan todas estas conclusiones y recomendaciones (y tal vez haya más) sigue dándose por la miopía de la que he hablado ya que no tenemos otros elementos que nos permitan ver mejor; insisto, esto se solucionará con el estudio de otras medidas descriptivas más adelante.

Para un mejor estudio y especialmente en variables que impliquen comportamiento humano se recomienda hacer los análisis de dos formas:

1. Con los datos simples como se hizo en el ejemplo anterior y

2. Agrupando los datos en base a algún criterio técnico

El hacer grupos o intervalos ayudará para realizar un mejor análisis ya que se podrá “desmenuzar” a la muestra en subgrupos de estudio que tendrán características más afines entre sí y por tanto las conclusiones y especialmente recomendaciones serán más precisas y acordes a las características específicas de los grupos establecidos.

En el caso del ejemplo, para hacer grupos podemos aglutinar a las personas cuya diferencia en tiempo de reacción sea más cercana entre sí ya que esto homogeneiza a personas con características similares en lo que se refiere a impacto emocional; el proceso (en Excel) sería de la siguiente manera:

1. Se colocan los datos en columna, no importa si están ordenados o no.

2. Debe establecerse con claridad la variable a estudiar y colocarla en la celda superior (no deje espacios entre esto y los datos).

3. Colóquese sobre la celda donde nombró a la variable (por ejemplo A1)

4. Haga “click” en la ficha “Insertar” del menú principal

5. Escoja “Tabla dinámica”

6. En el cuadro de diálogo que aparece en la Figura 8 debe encontrar que Excel le indica (en fondo negro) el rango de datos con el que va a trabajar, por ejemplo: Hoja1!$A$1:$A41; se recomienda que se acepte permitiendo que Excel cree una nueva hoja, acepte y siga al siguiente paso.



Figura 8: primer paso para generar una tabla dinámica

7. Excel habrá creado una nueva hoja (Figura 9) en la cual podrá trabajar con una tabla dinámica.



Figura 9: captura de pantalla de la nueva hoja

8. Hacia la derecha de dicha hoja (ver Figura 9) encontrará el nombre que dio a la variable, arrástrela hacia donde dice: “Etiquetas de fila” y suéltela allí, luego haga la misma acción pero arrastrando la variable hacia el campo: “Σ Valores”, según se indica en la Figura 10.



Figura 10: segundo paso para generar una tabla dinámica

Al hacer esto, notará que a la izquierda de la hoja se colocaron los datos de menor a mayor según se muestra en la Figura 11.



Figura 11: datos ordenados luego del segundo paso

9. Dependiendo de la configuración interna del Excel, al arrastrar la variable al campo “Σ Valores” aparecerá “suma de (y el nombre de la variable)”, hay que cambiar esto para que en su lugar aparezca “Cuenta de (y el nombre de la variable)”.

Para hacer el cambio haga “click” sobre “suma de…” y en el cuadro de diálogo que sale busque “configuración de campo de valor…” y en el nuevo cuadro escoja “cuenta” y acepte todo esto se ha representado en la Figura 12.



Figura 12: tercer paso para generar una tabla dinámica

Con esta acción, aparecerán los datos ordenados de menor a mayor y para cada valor se ha establecido la frecuencia con la que aparece cada uno, en este ejemplo, solo el valor 1.93 le aparecerá con frecuencia “2” (ver Figura 12)


10. Haga “clik” derecho sobre cualquiera de los valores de la variable (columna izquierda) y en el cuadro de diálogo que aparece escoja “Agrupar” según se representa en la Figura 13.



Figura 13: cuarto paso para generar una tabla dinámica

11. Luego de esto aparecerá un cuadro de diálogo igual al se presenta en la Figura 14:



Figura 14: cuadro de diálogo para establecer los intervalos

12. En “Por” puede escoger lo que se conoce como “ancho del intervalo” o “amplitud”, esto le ayudará a obtener grupos más afines en cuanto al tiempo de reacción.

Por ejemplo, si escoge 1.5 el resultado será igual al que se indica en la Figura 15:



Figura 15: datos agrupados con amplitud 1.5

A los valores que están a la izquierda de la tabla se los conoce como límites de cada intervalo y obviamente cada uno tiene dos: límite inferior y límite superior, por ejemplo, el límite inferior del tercer intervalo es 3.1 y el límite superior del mismo es 4.6. Fíjese también que el límite superior de un intervalo puede coincidir con el inferior del siguiente, cuando esto ocurre se dice que se ha realizado un cuadro de datos agrupados con límites coincidentes; esto no siempre va a suceder y normalmente será cuando la variable se haya medido con números decimales; pero cuando la variable es discreta, Excel hará intervalos cuyos límites no coincidan de un grupo (intervalo) a otro.

En ese caso se debe determinar lo siguiente: si un elemento coincide con un límite, ese valor pertenece al intervalo del límite superior que lo contenga, por ejemplo, si en este ejercicio hubiese un valor de 1.6, ese dato se toma en cuenta para el primer intervalo y ya no para el segundo.

En una primera observación se puede notar que la concentración de personas (frecuencia) en tiempo de reacción, es mayor hacia valores bajos de la variable que corresponde a los dos primeros intervalos [0.1 a 3.1] segundos.

Como ejemplo adicional se puede hacer un cambio en la amplitud en este caso de 2 segundos, en la Figura 16 se observa el resultado obtenido:



Figura 16: datos agrupados con amplitud 2

Con este cambio se puede observar que ya solo hay un grupo con mayor número de personas, por tanto, se intuye que la moda será un valor entre 0.1 y 2.1.

Con estos resultados el investigador puede establecer otras conclusiones y recomendaciones que serían más puntuales para cada grupo.

Como complemento a esta parte analítica se recomienda graficar (en datos agrupados) los resultados obtenidos ya que esto suele dar más luces para sustentar las conclusiones y recomendaciones; en todo caso observando el cuadro y recordando las conclusiones propuestas sobre este ejemplo ¿la tercera observación y conclusión dadas para los datos simples parecen ser las más acertadas no?

CÁLCULO DE LAS MEDIDAS DE TENDENCIA CENTRAL EN DATOS AGRUPADOS

Para calcular los valores de las Medidas de Tendencia Central debe completarse un cuadro (cuadro base) con la siguiente información en varias columnas:

Límites inferiores de cada intervalo “L. inf.”

Límites superiores de cada intervalo “L. sup.”

Punto medio (pm) de cada intervalo (también llamado marca de clase)

Frecuencia simple “f ” de cada grupo

Frecuencia Acumulada “fa” de cada intervalo (representa la suma de frecuencias de un intervalo a otro hasta llegar al total)

Frecuencia relativa “fr” de cada grupo es el valor porcentual que representa cada una de las frecuencias simples (se encuentra dividiendo cada valor de “f ” para el total de datos “n”

Frecuencia relativa acumulada “fra” tiene la misma idea de la frecuencia acumulada

El cuadro completo se vería tal como se muestra en la Figura 17 con el ejemplo desarrollado con amplitud 1.5



Figura 17: cuadro base para calcular medidas de tendencia central en datos agrupados

Con esto desarrollado ya se pueden realizar los cálculos para cada medida de tendencia central, así:

Los valores de Media, Mediana y Moda se pueden calcular con las siguientes fórmulas luego de agrupar los datos:

Media


f: frecuencia simple de cada intervalo

pm: punto medio de cada intervalo

n: tamaño de la muestra

Mediana


Para realizar los cálculos se sugiere resaltar el intervalo en el cual se va a aplicar la fórmula.

Ücretsiz ön izlemeyi tamamladınız.

Türler ve etiketler
Yaş sınırı:
0+
Hacim:
513 s. 423 illüstrasyon
ISBN:
9789978775301
Telif hakkı:
Bookwire
İndirme biçimi:
epub, fb2, fb3, ios.epub, mobi, pdf, txt, zip