Tabla de Contenidos
Definición principal
«Un histograma es un tipo de gráfico que cuenta con amplias aplicaciones en la estadística. Los histogramas permiten una interpretación visual de datos numéricos al indicar el número de puntos de datos que permanecen dentro del rango de valores, denominado una clase o compartimento. La frecuencia de datos que cae en cada clase es representada mediante el uso de una barra.»
Histogramas vs Gráficos de barras
A primera vista, los histogramas parecen ser lo mismo que un gráfico de barras.
Ambas estructuras emplean barras verticales para representar los datos. La altura de una barra corresponde a la frecuencia relativa de la cantidad de datos que hay en una clase, por lo que la barra más alta, representa a la frecuencia más alta de datos y la barra más baja, la frecuencia más baja de datos. No obstante, esto puede seguir pareciendo engañoso, ya que siguen habiendo similitudes entre ambos tipos de gráficos.
La razón de que estos tipos de gráficos sean diferentes tiene que ver con el nivel de medidas de los datos. Por una parte, los gráficos de barras son utilizados para los datos que están a un nivel nominal de medidas. Estos miden la frecuencia de los datos categóricos, y las clases para un gráfico de barras, son estas categorías. Por otra parte, los histogramas son utilizados por datos que, en último lugar, cuentan con un nivel ordinal de medida. Las clases para un histograma son amplios rangos de valores.
Otra diferencia clave entre los gráficos de barras y los histogramas tiene que ver con el orden de las barras. En un gráfico de barras es una práctica común distribuir las barras en orden de altura decreciente. Sin embargo, las barras dentro de un histograma, no pueden ser reordenadas. Deben mostrarse tal y como suceden.
Ejemplo de un histograma
El diagrama mostrado más arriba es un histograma. Supongamos que cuatro monedas se dan la vuelta y los resultados son registrados. El uso apropiado de la tabla de distribución binomial o de los cálculos sencillos con la fórmula binominal, muestra la probabilidad de que ninguna cabeza muestre 1/16, la probabilidad de que una cabeza esté mostrando 4/16, de que dos cabezas muestren 6/16, tres cabezas 4/16 y cuatro cabezas 1/16.
Construimos un total de cinco clases, cada una de una anchura. Estas clases corresponden con el número de cabezas posibles: cero, una, dos, tres, o cuatro. Si el diagrama de arriba fuera una barra vertical o rectángulo y contase con estas cuatro monedas y sus cabezas contables, las alturas de sus barras corresponderían con las probabilidades anteriormente mencionadas.
Histogramas y probabilidades
Lo antes mencionado no solo demuestra la construcción de un histograma, si no que también muestra la discreta probabilidad de distribuciones que pueden ser representadas con un histograma.
Para construir un histograma que represente una distribución de probabilidad, comenzaremos por seleccionar las clases. Estas deben ser los productos de un experimento de probabilidad. La amplitud de cada una de estas clases debería ser de una unidad, mientras que las alturas de las barras del histograma son las probabilidades de cada una de estas salidas o productos. Si se construye un diagrama de esta forma, las áreas de las barras también son probabilidades.
Dado que este tipo de histograma nos proporciona probabilidades, está sujeto a un par de condiciones. Una estipulación es que solamente los número no negativos pueden ser utilizados por la escala que nos proporciona la altura de una barra determinada del histograma. Una segunda condición es que desde que la probabilidad es igual al área, todas las áreas de las barras deben ser añadidas al total de una, equivalente al 100%.
Frecuencia en los histogramas
En estadística hay muchos términos que pueden tener pequeñas definiciones dentro de ellos. Un ejemplo, es la diferencia entre frecuencia y frecuencia relativa. A pesar de que hay muchas utilizaciones para las frecuencias relativas, solo hay una en particular que involucra a los histogramas. Este es un tipo de gráfico que cuenta con conexiones de otros temas en estadística y matemática estadística.
Por su parte, un histograma de frecuencia relativa es una modificación pequeña de un histograma de frecuencia típico. En lugar de utilizar un eje vertical con la cantidad de valores de datos que caen en un compartimento determinado, utilizamos este eje para representa la proporción general de valores de datos que caen esa clase. Si el 100% es igual a 1, todas las barras deben tener una altura de 0 a 1. Por lo tanto, las alturas de todas las barras de nuestro histograma de frecuencia relativa deben sumar 1.
Cómo crear un histograma
Clases o compartimentos
El primer paso es encontrar el valor más alto y más bajo, dentro del conjunto de datos. A partir de estos números puede ser computado el rango por substracción del valor mínimo y del máximo. No hay una regla fija, pero, en general, el rango debe ser dividido en cinco conjuntos pequeños de datos y en 20 para los grupos más grandes. Estos números darán lugar a una clase o compartimento amplio. Podemos necesitar redondear este número y/o utilizar el sentido común.
Una vez que la amplitud de la clase esté determinada, elegimos una de ellas, en la que se incluirá el valor de datos mínimo. Entonces utilizaremos la amplitud de clases para producir clases posteriores, parando cuando hayamos producido el máximo valor de datos.
Tablas de frecuencia
Una vez determinadas las clases, el siguiente paso es crear una tabla de frecuencias. Comienza con una columna que englobe las clases en orden creciente. La siguiente columna deberá tener un total para cada una de las clases. La tercera columna es para la cuenta o la frecuencia de datos de cada clase. Mientras que la columna final es para la frecuencia relativa de cada clase. Esto indica cuál es la proporción de datos en cada clase particular.
Dibujando el histograma
Ahora que has organizado los datos por clases, estás listo para comenzar a dibujar el histograma.
- Dibuja una línea horizontal. Estará donde vamos a anotar nuestras clases.
- Coloca marcas espaciadas de forma eventual a lo largo de esta línea, correspondientes a las clases.
- Etiqueta las marcas así la escala se verá clara, y proporciónale un nombre al eje horizontal.
- Dibuja una línea vertical, justo a la izquierda de la clase más baja.
- Elige una escala para el eje vertical que acomodará la clase con la frecuencia más alta.
- Etiqueta la escala para que quede clara y proporciónale un nombre al eje vertical.
- Construye barras para cada clase. La altura de cada barra debe corresponder con la frecuencia de la clase en la base de la barra.
Fuentes:
http://www.virtual.unal.edu.co/cursos/ciencias/2001065/html/un1/cont_114_14.html
http://es.educationcollege.info/college-higher-education/college/1008020164.html
Fer dice
Muy buena explicación, pude hacer mi histograma. ¡Gracias!