<
>

La incertidumbre de Sabermetrics con una temporada de 60 partidos

El sistema empírico que impulsó el éxito reciente de los Boston Red Sox y Chicago Cubs tiene pocas probabilidades de dar resultados positivos en una campaña recortada

Con información de Serguei Saavedra, Doctor en ciencias de la ingeniería por la universidad de Oxford; investigador y profesor en el MIT de la materia de probabilidad.

El 30 de octubre de 2019, los Washington Nationals se coronaron campeones de las Ligas Mayores . Esta fue la primera ocasión en la historia de la MLB que, en postemporada, una serie a ganar cuatro de siete juegos, todos los partidos fueron ganados por el equipo visitante. Comentaristas y analistas deportivos calificaron esta hazaña como un evento muy poco probable.

Para entender mejor el contexto de estos hechos, tomemos como ejemplo el juego de lanzar una moneda al aire, dejarla caer al suelo, y observar si cae águila (cara) o sol (cruz). Pensemos que esta moneda no es un objeto perfectamente simétrico, y por lo tanto al caer al suelo tendrá una inclinación por caer más de un lado que de otro, digamos que 45 por ciento de las veces cae en cara y el 55 por ciento restante cae en cruz. Si repetimos este juego siete veces y lo llamamos una serie, el porcentaje de veces que esperamos ver que todos los juegos en la serie caigan en cara se puede calcular como 0.45^7=0.0037, lo que equivale al 0.37 por ciento de las veces.

De igual forma, los datos nos han informado que en series de postemporada, los equipos visitantes ganan aproximadamente el 45 por ciento de las veces. Esto equivaldría a que en tres de cada 1000 series se dé el caso de que todos los siete juegos sean ganados por los equipos visitantes. Por lo tanto, basándonos en estos números, podríamos unirnos a los comentaristas. Sin embargo, no perdamos de vista que estos juegos de postemporada llevan 115 años realizándose, y ha habido aproximadamente 185 series a ganar cuatro de siete juegos.

Con esto en mente, ahora podemos preguntarnos, ¿cuál es el porcentaje de veces que en 185 series no se dé la hazaña de los visitantes? Con un poco más de cálculos, este porcentaje se puede estimar en 50 por ciento ((1-0.45^7)^185=0.5). Podríamos decir que el 30 de octubre fuimos testigos del resultado de haber lanzado en una sola ocasión una moneda perfectamente simétrica y apostar por que cayera cara. Tal vez no deberíamos de habernos sorprendido tanto de lo que pasó el año pasado.

La lógica que hemos usado para estimar los porcentajes anteriores está basada en la rama de las matemáticas llamada probabilidad. Esta misma lógica es la base del análisis empírico llamado Sabermetrics, el cual siguen todos los equipos de la MLB a mayor o menor medida para la toma de decisiones: desde a quién contratar, cómo evitar lesiones, hasta en qué posición poner a un jugador en el terreno de juego. Aunque este tipo de análisis se remonta casi a los inicios del béisbol, Sabermetrics tomó su nombre, rigor y aplicación hasta que Bill James publicó su conocido manifiesto en 1977, y después estas ideas fueron popularizadas al mundo a través del libro Moneyball, hecho película en el 2011.

Como hemos visto en el caso de los Washington Nationals, un análisis probabilístico puede brindar la capacidad de tener un conocimiento más objetivo y cuantificable del béisbol. El objetivo es formar y dirigir un equipo bajo restricciones monetarias para maximizar la probabilidad de anotar y prevenir carreras, lo que hace ganar juegos a un equipo.

Es gracias a Sabermetrics, que ahora sabemos que intentar robar la segunda base sin outs baja la probabilidad de anotar una carrera, a menos que el corredor tenga una muy alta probabilidad de éxito. Es también gracias a Sabermetrics que los Oakland Athletics, el primer equipo en adoptar este análisis empírico, se convirtieron en un equipo altamente contendiente a pesar de su bajo presupuesto salarial. Y cómo olvidarnos de cómo las Boston Red Sox rompieron la 'Maldición del Bambino', o cómo los Chicago Cubs ganaron el campeonato después de una sequía de más de 100 años, todo gracias a adoptar las prácticas de Sabermetrics y con muchas menos restricciones salariales que los A's.

Sin embargo, todo en esta vida tiene limitaciones, y la fortaleza de Sabermetrics es su propia debilidad.

Primero, Sabermetrics depende de los datos históricos para calcular las probabilidades de diferentes eventos. Es decir, estas probabilidades son definidas como la frecuencia de ocurrencia de un evento bajo un contexto definido. Por ejemplo, se sabe que la frecuencia con la que un bateador se coloca en base cuando tiene una cuenta de dos bolas y dos strikes es diferente de cuando tiene tres bolas y un strike. Esta frecuencia se va actualizando y su variación disminuye conforme se tiene más información, y se puede volver tan especializada como para cada combinación de jugador, equipo contrario, parque, clima, etc.

Segundo y más importante, las decisiones basadas en Sabermetrics son probabilísticas. Esto implica que, sólo a través de muchos juegos, las frecuencias esperadas son representativas de lo observado. En principio, esto no es un gran problema en la MLB, ya que la temporada tiene en su formato moderno 162 partidos, lo que da pie a la aplicación de Sabermetrics. No obstante, la postemporada se trata de ganar tres juegos de cinco o cuatro de siete.

En estos escenarios cortos, los equipos que logran disminuir la variabilidad en sus estimaciones suelen tener mayor éxito. Por ejemplo, volviendo al caso de nuestra moneda, si pudiéramos controlar exactamente la fuerza e inclinación con la que lanzamos (como ya se ha hecho y comprobado), en teoría podríamos eliminar la incertidumbre de cara o cruz. De la misma manera, si un equipo cuenta con jugadores de baja variabilidad (usualmente, pero no necesariamente, son los que tienen salarios más altos), y tratan de mejorar y controlar las condiciones en al menos cuatro juegos, sus estimaciones serán más cercanas a la realidad (claro, sin tomar en cuenta las trampas en las que se han involucrado los Houston Astros u otros equipos para controlar mejor las condiciones). Podríamos argumentar que es por ello que los A's no han tenido tanta suerte en postemporada.

Este año, la pandemia del COVID-19 ha ocasionado que la temporada de béisbol se recorte a 60 juegos por equipo. Esto significa que la incertidumbre en torno al desempeño de los jugadores y equipos es mayor que en años anteriores, pues no habrá el beneficio de una muestra amplia de eventos que ayuden a las predicciones de Sabermetrics.

Al haber un número menor de juegos, tanto jugadores que tienen bajos porcentajes históricos de bateo pueden acabar en los primeros lugares, tanto como aquellos de los que se espera grandes cosas pueden terminar sin destacar esta temporada. Por ejemplo, recordemos aquellos Oakland A's del 2002 que obtuvieron el 63 por ciento de juegos ganados en la temporada regular, y rompieron un récord de la Liga Americana al ganar 20 juegos consecutivos, racha que fue glorificada en Moneyball. Este récord se llevó a cabo casi al terminar la temporada. Es decir, si pudiésemos regresar la cinta del tiempo bajo las mismas condiciones, y si la temporada se hubiera terminado a los 60 juegos, Oakland no habría roto tal récord.

De hecho, considerando el porcentaje de 63 por ciento de juegos ganados, podemos calcular que la probabilidad de haber realizado tal hazaña en 162 partidos fue de 3.1 por ciento (1-10^(143*log(1-0.63^20))). Cambiando a 60 partidos, esta probabilidad disminuye más de un tercio (0.9 por ciento). A pesar de estas relativamente bajas probabilidades (recordemos que todo depende del contexto de los eventos), los Cleveland Indians llegaron a 21 juegos ganados consecutivamente en el 2017 (también ganaron el 63 por ciento de todos sus juegos), e interesantemente, lo lograron también casi al final de la temporada.

Por lo tanto, Sabermetrics tendrá que ajustar estimaciones no sólo a las nuevas reglas implementadas por la MLB, sino también al hecho de que se está entrando a un terreno de corto plazo poco adecuado para Sabermetrics (en especial cuando se tienen importantes restricciones salariales).

Si la pandemia no impide que acabe la temporada (como ahora se está viendo con los Miami Marlins), tal vez seamos testigos de eventos poco probables, pero que no serán menos probables que en una temporada regular.

Si de algo debemos de estar seguros, es que el azar jugará un papel más importante esta temporada, y las medidas probabilísticas de Sabermetrics tendrán que ser entendidas no como la frecuencia de un evento en muchas repeticiones si no simplemente como el grado de incertidumbre de dicho evento.