Un diagrama de caja es una gran manera de obtener un sentido visual de un rango completo de datos. Puede informarle sobre sus valores atípicos y cuáles son sus valores. También puede indicarle si sus datos son simétricos, el grado de agrupación de sus datos, y si sus datos están sesgados y cómo.
Los gráficos de caja dividen los datos en sus cuartiles. La “caja” muestra al usuario el conjunto de datos entre el primer y el tercer cuartil.
La mediana se dibuja en algún lugar dentro de la caja y luego se ven los valores no extremos para terminar el gráfico. Estas líneas se conocen como “bigotes”. Si hay algún valor atípico, también se puede trazar.
Con los gráficos de caja puede responder a la diversidad o uniformidad de sus datos. Puedes identificar lo que es normal y lo que es extremo. Los gráficos de caja ayudan a dar una forma amplia a los datos sin sacrificar la capacidad de mirar cualquier pieza y hacer más preguntas.
Muestra el resumen de cinco números de un conjunto de datos. El resumen de cinco números es:
- mínimo
- primer cuartil (Q1)
- mediana
- tercer cuartil (Q3)
- máximo
Puedes leer más acerca de gráficos de cajas aquí.

Observación:
- El gráfico anterior muestra el aumento de la calidad del vino con el aumento del alcohol. La calidad del vino está directamente relacionada con la cantidad de alcohol que contiene. Cuanto más alcohol tenga el vino, mejor será su calidad.
- Además, los puntos que se encuentran fuera de los bigotes (las líneas que se extienden desde la caja rectangular) son los valores atípicos.