Sin el ánimo de profundizar en las características de esta representación, se puede decir que el diagrama de hojas y ramas (García-Pérez, 2015) o también llamado gráfico de tallo y hojas es otra forma para representar variables de tipo cuantitativas. Este tipo de representación recuerda a un histograma pero girado 90º. De hecho la interpretación visual es exactamente igual que el histograma.
Su mayor diferencia frente al histograma es que este diagrama permite recuperar todas las observaciones. En otras palabras, mientras que en el histograma los datos se agrupan en intervalos, aquí, podemos obtener cada uno de los datos.
En R se puede generar un diagrama de tallo y hojas con la función stem (...). Para entender mejor la forma de crear este gráfico, se propondrá un ejemplo práctico ficticio para contextualizar el proceso.
Caso práctico
Una investigación ha medido la puntuación de una prueba de tiro en 20 participantes noveles en el uso de armas de fuego. La puntuación máxima que se puede obtener es de 75 puntos. Ordenando los datos por puntuación ascendente, los participantes obtuvieron los siguientes resultados: 12, 15, 16, 21, 24, 29, 30, 31, 32, 33, 45, 46, 49, 50, 52, 58, 60, 63, 64 y 65. Se quiere elaborar un gráfico, en este caso, un diagrama de hojas y ramas, sobre estos datos para presentarlos en una comunicación oral de un congreso sobre armas.
Para este ejemplo, se empleará directamente el entorno R (versión 4.3.1) en un ordenador MacBook Pro (MacOS Ventura). Se recuerda que este mismo proceso se puede realizar en un ordenador con sistema operativo Windows. Además, este mismo ejemplo se puede hacer, si se prefiere, en la aplicación RStudio. Como los datos son tan pocos, se introducirán directamente con el nombre calificación.
Procedimiento
En primer lugar, se introducirán los datos en modo de variable vectorial. El nombre que se ha propuesto para este caso práctico es calificación y los datos seguirán el orden del enunciado del caso práctico. Téngase en cuenta que la separación de los valores debe ir con comas y la separación decimal con puntos.
> calificación = c(12, 15, 16, 21, 24, 29, 30, 31, 32, 33, 45, 46, 49, 50, 52, 58, 60, 63, 64, 65)
Ahora, con tan solo invocar el nombre "grasa", R nos lanzará los valores introducidos en dicha variable vectorial. Para solicitar el diagrama de hojas y ramas de estos datos, deberemos usar la instrucción stem (...). En nuestro caso, sustituiremos los tres puntos por el nombre de la variable introducida.
> stem (calificación)
Resultados
El resultado se mostrará a continuación de la instrucción solicitada (parte izquierda de la siguiente imagen). Sin embargo, este diagrama es un tanto confuso. Podemos ver que si extrajésemos cada caso, tomando la parte decimal donde está cada | tendríamos observaciones completamente distintas a nuestros datos del ejemplo: 0,2; 0,5; 0,6... 6,4 y 6,5.
Realmente el gráfico no está equivocado, simplemente R ha agrupado cada fila (llamada también tallo) en varios valores. Por ejemplo, la segunda fila del diagrama se ha agrupado con los valores 2X y 3X. Entonces, es necesario introducir una instrucción dentro de la función stem que haga que se modifique la altura del gráfico y que cada tallo represente un único valor decimal. Esta instrucción se llama scale = x, donde x es un número, que suele ser 2. Cuanto más grande sea el número, más alto será el diagrama. Entonces, para obtener el diagrama de hojas y ramas más intuitivo, deberemos escribir:
> stem (calificación, scale = 2)
Entonces, sin ajustar el ancho del diagrama, obtendremos una figura más parecida al histograma. Sin embargo, ajustando el ancho su interpretación será mucho más intuitiva. Por tanto, ya que estos resultados se mostrarán en una comunicación oral a un congreso, se recomienda usar el segundo diagrama que se ha obtenido.
Fuente bibliográfica
Referencia en estilo APA-7:
- García-Pérez, A. (2015). La interpretación de los dato: una introducción a la Estadístic Aplicada. Librería UNED.
No hay comentarios:
Publicar un comentario