La desmitificación progresiva de las estadísticas defensivas

Bradford Doolittle | Escritor Senior de ESPN

25 de mar, 2018, 14:13 ET

PHOENIX, Arizona - Un par de semanas atrás, acudí a la séptima edición anual de la Conferencia SABR de análisis estadístico, en la cual se escenificaron tres días de discusiones con paneles y presentaciones que nos dan un indicio del alcance de las nuevas fronteras de la investigación beisbolística. El rango de los tópicos tratados fue asombroso y se extendió mucho más allá del ámbito del mero análisis estadístico.

¿Están interesados en conocer el rol de la neurociencia en el desarrollo de peloteros? ¿O qué tal les parece analizar el éxito de los medios de comunicación deportivos a la hora de comunicar los preceptos analíticos? Esta Conferencia de la SABR (Sociedad para la Investigación del Béisbol, por sus siglas en inglés) trató eso y mucho más. Sin embargo, fue primero y principalmente una conferencia que giró en torno al análisis estadístico y por ello, el evento giró en torno a presentaciones sobre estadística en mayor medida.

Hubo muchas presentaciones interesantes. Sin embargo, las dos que más resonaron en mí trataron de un tema que es muy afín a mis gustos: la defensiva. En resumen, estas fueron mis conclusiones: Nunca habíamos contado con mejores herramientas para la evaluación de los fildeadores hasta ahora. Y aún tenemos un largo camino por recorrer para poderlas aprovechar al máximo.

Este es un tema inherente a cada disciplina deportiva y así siempre lo ha sido. Hemos desarrollado métodos probados y comprobados para examinar la forma en la cual los equipos anotan carreras. Pero no hemos tenido la misma medida de éxito a la hora de poder registrar cómo éstos evitan que sus rivales anoten carreras. Y cuando se piensa bien al respecto, lo último es tan importante como lo primero.

Las estadísticas defensivas han sido, por mucho tiempo, el "coco" del análisis beisbolístico. El problema siempre ha radicado en que los elementos que hemos logrado catalogar y rastrear (outs realizados, asistencias, errores, dobles matanzas, etcétera) no nos han dicho mucho con respecto a la calidad de determinado pelotero. Lo mismo podría decirse en el ámbito colectivo.

Estas medidas de larga data podrían haber sido útiles en las etapas iniciales del béisbol, cuando los equipos promediaban poco más de dos errores por encuentro. Ahora, esa cifra se aproxima a medio error por cotejo. Es un evento tan poco ocasional que ya prácticamente nadie juzga a un fildeador sólo por los errores cometidos. Eso representa un progreso. Desafortunadamente, aún no existe en la actualidad un consenso en la forma en la cual se pueda medir la eficiencia de un fildeador.

Me he inclinado enfáticamente en utilizar la métrica de carreras salvadas a la defensiva (DRS, por sus siglas en inglés), desarrollada por Baseball Info Solutions y la cual se encuentra fácilmente disponible en baseball-reference.com, fangraphs.com y en TruMedia, los cuales utilizamos muy frecuentemente aquí en ESPN. Es un buen sistema, sin embargo, sigue siendo imperfecto; lo cual fue evidente cuando Baseball Info Solutions hizo su presentación en la Conferencia SABR.

La métrica DRS mide la cantidad de jugadas hechas por un fildeador comparadas con el promedio de los jugadores en su posición. Cada pelota puesta en juego es rastreada y evaluada en cuanto a la posibilidad que ésta tiene de convertirse en out. Se mide la cantidad de jugadas hechas por un pelotero, contra la cantidad de jugadas que se esperaría que éste hiciera, basándose en la actuación promedio, lo cual redunda en una simple medida plus-menos. Convertimos esa cifra en carreras y allí tenemos la cantidad de DRS.

La métrica DRS tiene una correlación positiva de temporada a temporada. En otras palabras, el DRS de un pelotero en una temporada nos vislumbra lo que podríamos esperar de él en la campaña siguiente. Desafortunadamente, esa correlación no es particularmente alta y termina siendo mucho menor comparada con, digamos, el promedio de ponches o poder aislado. El valor de cada métrica radica en su previsibilidad. El DRS tiene valor predictivo, aunque no el suficiente para que uno pueda hacer lo que realmente se desea con el uso de este, o sea, predecir cómo podrían quedar los equipos defensivamente hablando, con el mismo grado de confianza que se tiene al utilizar estadísticas ofensivas.

A fin de ilustrar este punto, revisemos la carrera en DRS del que es considerado de forma prácticamente unánime como el mejor pelotero del béisbol. Directamente del Bill James Handbook en su edición 2018, aquí les presentamos los totales de Mike Trout en DRS por cada temporada:

2012: +19
2013: -11
2014: -12
2015: +5
2016: +6
2017: -6

Y casos como el de Trout se mutiplican de forma dramática. No podemos atrevernos a esperar la perfección por parte de una estadística defensiva; sin embargo, por lo menos nos gustaría creer que la misma sirve de instantánea fidedigna del valor relativo que tiene a la defensiva el mejor pelotero del béisbol. En toda su carrera, Trout tiene plus-1. Entonces, ¿realmente Trout termina siendo un fildeador ubicado apenas dentro del promedio de la liga? Sus números, año tras año, van desde lo excelente hasta lo terrible, y no pudiera entonces intentar apostar cómo terminaría dicha cifra en 2018.

Voy a ser enfático nuevamente: DRS es una métrica solvente. Mismo caso con la métrica UZR (rating definitivo de zona), el sistema para medir jugada tras jugada, desarrollado por el analista Mitchel Litchman y el cual también está disponible en FanGraphs. (Según la métrica UZR, Trout tiene 6.5 carreras sobre el promedio durante toda su carrera). Esas herramientas son muy superiores a todo lo que tuvimos disponible antes de su llegada. Aunque, tampoco nos dejan en el sitio al cual queremos llegar.

Baseball Info Solutions presentó su sistema DRS mejorado en la conferencia, al cual denominan "PART". Lo cual utiliza las siglas en inglés "(P)ositioning, (A)irballs, ( R)ange, (T)hrowing", o sea, "Posicionamiento, pelotas en el aire, rango, lanzamiento". Este nuevo sistema fue diseñado a fin de medir cada destreza defensiva de forma aislada y luego combinarlas para concluir con una nueva versión de la métrica DRS. Utilizará los datos originados por Statcast con respecto al posicionamiento de peloteros y hará un trabajo muy superior a la hora de evaluar el rango de los jugadores en situaciones de cambio.

¿Suena excelente, verdad? Pues, aquí lamento ser el portador de malas noticias. Este sistema está siendo comercializado entre los equipos de Grandes Ligas pero, a primeras de cambio, no estará disponible al público. En lo que a nosotros respecta, seguiremos recibiendo la misma versión de la métrica DRS que hemos estado utilizando en años recientes. Esto refleja un problema inherente cuando cubrimos béisbol desde una perspectiva analítica. Al final, las mejores herramientas siguen cubiertas tras un velo de misterio. Los equipos están colocando sus datos en nuevos sistemas y forma de desarrollo interna a fin de conseguir cualquier ventaja para dejar atrás al resto. No es algo malo, pero es una forma de vacilar.

Esto no significa que el resto de los mortales no tendremos juguetes nuevos a nuestra disposición esta temporada. En la Conferencia SABR, los chicos brillantes de la división de MLB.com que maneja Statcast presentaron una versión extendida de la presentación que nos dieron en la sede de ESPN el mes pasado. Hay muchas cosas emocionantes que veremos gracias a toda la data que han capturado las cámaras que registran los movimientos de los peloteros en cada estadio. Para mí, lo mejor de todo serán las nuevas herramientas defensivas.

Primero que todo, lograron resolver el problema que tenía Statcast con las llamadas "pelotas contra muro", aquellas que parecían ser de rutina en las tablas estadísticas, porque el sistema no reconocía que el fildeador tenía que lidiar con un muro cercano. Eso ha sido rectificado y debería redundar en una serie de estadísticas de probabilidad de atrapadas más precisa de ahora en adelante.

Aún mejor: el equipo de Statcast se encuentra muy cerca de presentar su sistema para medir la actuación de los jugadores del cuadro con pelotas bateadas. En otras palabras, esta temporada ya deberíamos contar con data tan precisa con respecto al juego en el cuadro como la que ha generado Statcast para medir el juego en los jardines. Ademas, Statcast va a presentar nuevas herramientas para medir a los receptores (tiempo que tardan en reaccionar a un batazo, tiempo de lanzamiento, etc.). Estamos muy cerca de contar con una serie de estadísticas completas que nos servirán para analizar el desempeño de los fildeadores en el campo de juego, basándonos en un rastreo muy juicioso de cada movimiento hecho por ellos.

Tal como bien lo demostró el dilema de las "pelotas conta el muro", siempre habrán sutilezas imprevistas que deberán servir para correcciones posteriores. Un tema que surgió en la conferencia gracias a la pregunta de un asistente fue con respecto al "efecto Manny". El hecho de contar con un jugador con un rango sobrenatural como Manny Machado, ¿en cuánto afecta el desempeño y posicionamiento de los peloteros que están a su lado? En estos momentos, no lo podemos determinar con certeza, aunque sospechamos que no les hace daño precisamente.

Estas nuevas métricas estadísticas siguen, lenta y progresivamente, su camino hacia la madurez. La utilización de la data de posicionamiento provista por Statcast en el sistema BIS debería ser de mucho beneficio y aspiramos que pronto podamos constatar si esto redunda en contar con una mejor correlación temporada a temporada dentro de la métrica DRS.

En lo que respecta al propio Statcast, debemos recordar que esta data de rastreo es aún muy reciente. No contamos con suficientes datos año tras año para saber exactamente qué podemos hacer con ellos. ¿Cuáles son los valores de carreras que podemos concluir? ¿Cuánta correlación existe en los promedios de atrapadas entre una temporada y la siguiente? ¿Cómo se puede comparar la curva de envejecimiento de un campocorto con la de, digamos, un jardinero central? A un nivel más alto, ¿cuán volatil es el desempeño defensivo, comparado con el bateo o el pitcheo? Mi instinto me dice que es menos volátil, aunque no contemos actualmente con un instrumento que nos pueda decir con precisión si eso es cierto o no.

Cuando las estadísticas defensivas alcancen todo su potencial (sea cual sea), podrían tener un efecto tremendo que cambie nuestra idea del rol que tiene el fildeo en el béisbol. Quizás termine siendo más importante de lo que jamás hayamos pensado. O quizás su efecto termina siendo minúsculo, ya que un pelotero debe tener cierto nivel de agudeza para poder llegar a las Mayores. Y cuando sepamos que nuestras métricas actuales funcionan perfectamente, podremos mirar hacia atrás y perfeccionar nuestras métricas más antiguas y así poder responder interrogantes que nos han merodeado durante décadas.

Sabremos que las métricas defensivas alcanzaron la madurez cuando hayan logrado ciertos niveles de estabilidad. El primero vendrá con la previsibilidad: cuando contemos con una serie de correlaciones entre temporada y temporada, además de curvas de madurez medibles y tangibles, junto con la confianza en nuestras métricas actuales de carreras salvadas y costo de carreras. Entonces, podremos hacer una labor mucho mejor a la hora de predecir el orden de los equipos desde una perspectiva defensiva. Otra forma en la cual podremos saber si las métricas defensivas han madurado será cuando los distintos sistemas comiencen a concordar más frecuentemente en sus criterios, algo muy distinto a lo que vemos en la actualidad.

Cuando eso ocurra, quizás podremos saber final y definitivamente si Mike Trout es, o no, buen fildeador, o uno dentro del promedio o, por el contrario, uno mediocre.