Analítica de datos de 14k recetas de cerveza en R

Post completo (15 minutos)

Como homebrewer, una de las páginas que utilizo para simular y ajustar mis recetas de cerveza es www.Beertools.com:

Esta base de datos contiene información detallada de ingredientes, parámetros y comentarios para cada una de las recetas, lo que constituye una excelente fuente de información para realizar análisis de los datos, por lo que decidí realizar el “scraping” de las mismas (tema para otro post!). Esto también me sirvió para contestar algunos de los interrogantes que tenia en relación a las preferencias de los homebrewers que realizan la carga de sus recetas en esta base, como por ej:

  • Cómo es la distribución de IBUs (medida del amargor de la cerveza), SRM (color de la cerveza), OG y FG (gravedad original y final, respectivamente) del dataset?
  • Cuales son los estilos de cerveza predominantes en la base de datos?
  • Hay cambios en la preferencia de estilos a través del tiempo?
  • Cuales maltas se utilizaron en cada estilo y en qué proporción?
  • Cuales son las levaduras (líquidas y deshidratadas) más utilizadas?
  • Hay alguna tendencia entre IBU, OG y SRM?
El análisis se realiza en RStudio luego de importar los datos del scraping (+14k recetas de cerveza).
 

Histogramas de IBU, OG, FG y SRM

En los histogramas podemos ver lo siguiente:

  • La moda en cuanto a OG (gravedad original) se encuentra entre 1050 y 1055 mg/cm3, lo que correlaciona con cervezas de entre 4-6° de volumen alcohólico dependiendo de la gravedad final
  • El valor de mayor frecuencia en FG (gravedad final) es 1011 mg/cm3, que es el objetivo más común al momento de diseñar una receta (FG mayores se utilizan para lograr cervezas más dulces, mientras que FG menores a 1010 indican cervezas secas)
  • La frecuencia de valores de la FG se alinea muy bien con una distribución normal con media en 1011, contrastando con el resto de las variables (bimodal para SRM y lognormal para IBU y OG)
  • La preferencia de los usuarios es a realizar cervezas balanceadas en cuanto a amargor, lo que se evidencia con una mayor frecuencia en torno a los 20-30 IBUs
  • Finalmente, en cuanto al SRM (“Standard Reference Method”, el color de la cerveza) se ve un comportamiento bimodal, indicando que los usuarios que generaron las recetas prefieren cervezas claras (SRM < 5) y cervezas rojas o cobrizas (SRM en torno a 12)
  • Por último, se nota un leve incremento en la frecuencia del SRM para valores de 24 y 34 SRM, correspondiente a las cervezas oscuras (por ejemplo, SRM = 24 para Porters y SRM = 34 para Stouts)

Composición de maltas por estilo (GRAFICO INTERACTIVO!)

Haciendo click en el gráfico de “sunburst” se puede visualizar los subestilos y la composición porcentual de granos de cada uno de ellos. Por ejemplo, para las IPAs se ve una clara predominancia de la malta base y pequeñas proporciones de otras maltas que agregan levemente color y complejidad al estilo, como son las caramelo y las Munich / Vienna:

En contraste, las Stouts muestran un drástico incremento en las maltas oscuras (Chocolate y Cebada tostada, acá incluida dentro de la categoría “other malts”) , lo que es esperable en el estilo:

Estilos de cerveza predominantes

El gráfico de barras muestra la frecuencia de recetas con los diferentes estilos de cerveza. El color varía dentro de cada barra para poder visualizar el SRM de la receta indicada.

Se ve claramente que las American Ales es el estilo preferido de los usuarios, seguido por las IPAs y Stouts.

En el limite inferior se ven los estilos menos preferidos, entre ellos las Sour y Ahumadas.

Evolución de estilos en el tiempo

Este gráfico está altamente influenciado por la cantidad de recetas informadas por los usuarios de BeerTools, por lo que los límites inferior (años 1999 y 2000) y superior (año 2017 en adelante) no son representativos. El motivo de esto es la aparición de nuevas plataformas de diseño de recetas (por ej: BrewersFriends) y la migración de muchos usuarios de BeerTools a esas plataformas.

Aún así, en los años que se consideran representativos, se puede ver a tendencia alcista de las IPAs y las Belgas, algo esperable debido al gran auge de estos estilos en los últimos años. También se puede ver el mantenimiento de estilos como Stout y LHB (cervezas suaves, es el estilo que producen las cervecerías industriales) y la disminución de otros, como Porter y English Ale

 

Utilización de levaduras

Claramente la preferencia de los usuarios es utilizar levaduras líquidas, ya que ofrecen mayor variedad de cepas y perfiles que las levaduras secas.

El mismo gráfico puede visualizarse como treemap:

La preferencia por levaduras secas se visualiza en el siguiente gráfico:

Aquí también se visualiza una gran preferencia por la US05 y S04 de Fermentis.

 

Relación entre IBU y OG individualizada por SRM

Debido a la gran variedad de estilos e interpretaciones de los usuarios hay una gran dispersión de los puntos en el gráfico. Aun así se nota una leve tendencia lineal positiva y una correlación al incremento de SRM (cervezas más oscuras) a medida que aumetan los IBUs y la OG. Por el contrario, las cervezas más claras (SRM más bajo) tienen OGs y IBUs menores.

Hay algunos “outsiders” en OGs e IBUs correspondientes a los estilos más fuertes, por ejemplo las Russian Imperial Stouts (alta OG, alto SRM e IBUs medios-altos) y las  Imperial IPAs (alto IBU, OG media-alta, SRM medio)

Deja un comentario

Tu dirección de correo electrónico no será publicada. Los campos obligatorios están marcados con *