<
>

Las estadísticas sin las que no puedo vivir

Uno tiene que mirar bien las estadísticas avanzadas para apreciar bien las razones del éxito de Matt Cain. AP Photo/Matt Slocum

Nota del editor: El martes, ESPN The Magazine publicó su Edición Analítica, con una historia hecha por Sam Miller sobre la razón por la que los fanáticos del béisbol deben adoptar la métrica WAR (victorias por encima del reemplazo, por sus siglas en inglés). Le pedimos a Keith Law que nos dijera cuáles son sus 'estadísticas para sobrevivir', las que necesita fuera de toda duda para evaluar a los jugadores.

El tener el WAR de un player, incluso si sabes cual versión de WAR es, no terríblemente útil por sí mismo a menos que sepas el desglose de los números que van con él.

WAR es solo el final de un proceso de normalizar diferentes áreas del juego de un pelotero -- para un bateador, eso es la ofensiva, defensiva y corrido de bases, con un ajuste para los estándares ofensivos de su posición -- de manera que se puedan añadir juntos en un solo número.

Cualquier sistema de valoración de producción debe destilar las contribuciones de un jugador en un número que representa las carreras añadidas/salvadas si es una contribución positiva y el costo de carreras si es una negativa. Si tienes el WAR de un jugador, no tienes idea de cuánto él contribuyó al éxito o al fracaso de su equipo, y no puedes evaluar la fiabilidad del número, porque no sabes cuánto vino de la ofensiva, que es una de las cosas más fáciles de medir adecuadamente, y cuanto de la defensiva, que es una de las cosas más difíciles de medir.

Y debido al hecho de que los jugadores crean valor de formas diferentes, eso afecta la manera en que nosotros los evaluamos. Por ejemplo, yo me siento un poco menos confiado de que Michael Bourn pueda sostener su valor de ahora en adelante porque gran parte de su WAR en los últimos años vino de sus piernas -- gran defensiva y valor añadido en las bases. No solo que las métricas defensivas son un poco menos precisas que las ofensivas (a pesar que ahora se miden mejor que hace 10 años), pero tener el desglose nos permite ver cuánto Bourn depende de su velocidad para ser un jugador valioso. Si sus piernas se van con la edad, o si sufre de una o más lesiones importantes en las piernas, su valor bajará rápidamente. Si su valor viene en gran medida de su bate, podríamos tener otras preocupaciones, pero no la misma sobre su velocidad.

A menos que se comparen dos jugadores cuyos WAR estén tan lejos uno del otro que no haya duda de quién es el jugador más valioso -- digamos, Mike Trout versus Miguel Cabrera el año pasado -- tener el WAR solamente nos sirve de punto de inicio pero no es algo definitivo ni final.

Con eso en mente, aquí le echamos un vistazo a algunas de las estadísticas que yo siempre utilizo cuando miro la página de estadísticas de un jugador en FanGraphs o Baseball-Reference para al menos tener una idea inicial del valor del jugador:

wOBA (promedio ponderado de embase)

Esta es la mejor estadística que he encontrado para medir la producción de un bateador en una tasa base. Esto nos dice cuan productivo fue el jugador cuando jugó, pero no dice cuanto jugo, y por ende se pierde un componente importante para decirnos exactamente el valor de su contribución.

Ya que suelo preocuparme más por mirar adelante que evaluar el pasado, paso más tiempo mirando estadísticas proporcionales que estadísticas acumuladas. El wOBA toma las siete maneras en que un jugador puede llegar a base y por las que puede recibir algún crédito -- sencillos, dobles, triples, jonrones, bases por bolas no intencionales, las veces que eres golpeado y las veces que te embasas por un error -- y sopesa cada una de ellas en su valor relativo a la producción de carreras, y las divide por las apariciones en el plato. El resultado produce un número que usualmente se coloca entre los .300-.450, lo que lo convierte en una escala similar al OBP y por ende más familiar ante nuestros ojos. Si quieren un buen número para saber cuan bueno es un bateador, esta es mi selección.

OBP y slugging

Los dos mejores indicadores básicos de lo que hace un bateador -- es algo incompleto, pero sirve de sólido punto de partida. El OBP (porcentaje de embase, por sus siglas en ingles), nos dice cuan frecuentemente llega un bateador a la base; el recíproco de esto, 1 menos OBP, nos dice cuan frecuentemente un jugador es out. Un jugador con un OBP de .300 es out en el 70 por ciento de sus apariciones en el plato, lo que no es deseable para nadie excepto para el lanzador que se mida a él.

El porcentaje de slugging, y su pariente el poder aislado (slugging menos promedio), nos da una medida rápida y familiar a la producción de poder. El slugging tiene defectos porque mide cada base conseguida de la misma forma; la base más difícil de llegar es la primera, y la diferencia entre un doble y un triple está usualmente en la velocidad del bateador en vez de su habilidad para avanzar corredores que ya están en base. A pesar de esto, el slugging, al igual que OBP, es un buen punto de partida para más análisis.

Pero por el amor de Pythagoras, por favor no sumen esos dos números y pretendan que el resultado significa algo. Es un gigantesco fallo matemático, algo que quizás los ingenieros del Puente del Milenio puedan entender. Tienes dos fracciones con diferentes denominadores -- el OBP nos da una proporción por aparición en el plato, mientras que el slugging nos da una proporción por cada turno al bate -- así que simplemente no se pueden sumar ambos números sin tomar eso en cuenta.

OPS, la estadística que resulta de la suma directa de las dos antes mencionadas, ignora la diferencia en valor entre ambas -- un punto de OBP extra vale mucho más para el potencial de anotación de carreras de un equipo que un punto de slugging.

Consideren a dos jugadores con un OPS de .800: Uno tiene un OBP de .350 y slugging de .450, y uno tiene un OBP de .400 y slugging de .400. El segundo jugador es claramente más valioso: Hace menos outs que el primer jugador, y el número de veces adicionales que está en base excede el número de bases adicionales añadidas por el primer jugador. El OPS no te diría eso, pero el wOBA quizás sí.

Moverte del wOBA al OBP y slugging te ayuda a entender más lo que hace valioso o no a un jugador, sin perder de vista cuan bueno fue él en relación a sus compañeros o forzándote a conectar dos piezas que simplemente no encajan.

Ponches y porcentaje de boletos

Hay dos cosas que un lanzador puede hacer por sí mismo y que puede "controlar", según el vernáculo de los análisis del béisbol -- puede ponchar a un bateador y lo puede embasar. Como dijo el famoso sabermétrico Capitán Obvio alguna vez, uno quiere lanzadores que hagan mucho de lo primero y poco de lo segundo.

Esas proporciones no están sujetas al ruído presente en las estadísticas de los lanzadores que incorporan tasas de hits, pelotas en juego o incluso tasas de cuadrangulares -- esa data también es importante, pero requieren interpretación adicional, incluyendo efectos de los estadios y ajustes por ayuda defensiva, ayuda en el bullpen o daños, y también simplemente algo del azar. Si un lanzador puede hacer que fallen los bates, eso se mostrará en su tasa de ponches -- y si un slider superior no logra hacer abanicar los bates, entonces quizás no es tan superior después de todo.

Si un lanzador tiene control superior, no debería otorgar bases por bolas. Si embasa demasiados bateadores, quizás sea su control, o quizás algo mecánico, o quizás la manera de lanzar, pero por la razón que sea, no es, utilizando el término técnico, bueno. Como anotación al margen, siempre prefiero sacar las bases intencionales de las tasas de pitcheo, ya que son decisión del manager, y no un reflejo de las habilidades del lanzador.

Es más instructivo utilizar porcentajes de ponches y bases por bolas -- contrario a ponches y boletos por cada nueve entradas -- porque algunos lanzadores se enfrentan a más bateadores por entradas que otros lanzadores, lo que significa que tienen más oportunidades de poncharlos o darles la base por bolas.

Porcentaje de roletas

De nuevo, es mejor expresado como una tasa del total, en este caso de todas las pelotas puestas en juego si es posible, a pesar que en ocasiones utilizamos los outs en el campo (roletas/elevados) como una especie de proxy. La habilidad de un lanzador de mantener la pelota en el suelo indica dos cosas -- que quizás no sea propenso a que le conecten cuadrangulares (asumiendo que no tiene una recta por debajo del promedio o el mal hábito de dejar curvas en el medio del plato) y que podría generar muchas dobles matanzas.

Una roleta en juego es más probable que se convierta en hit que un elevado, pero menos probable que se convierta en un extrabase; como se pueden imaginar, una línea en juego es el tipo de batazo que más probablemente se convierta en hit, pero las tasas de líneas no parecen estar bajo el control de la mayor parte de los lanzadores y los datos están plagados de problemas de clasificación. Los datos sobre las roletas son más confiables, y pueden ayudar a responder la pregunta de si un sinker en realidad se hunde en términos que signifiquen algo.

BABIP (promedio de pelotas en juego)

El promedio de pelotas en juego es simplemente la tasa en la que un lanzador permite un hit con pelotas puestas en juego -- así que eso elimina los ponches, bases por bolas y tipicamente jonrones (a pesar que pienso que es justo preguntar si los HR deberían siempre ser retirados de aquí), y solo miramos a las pelotas que entran al terreno de juego y si se convierten en hits o no.

El concepto central es que los lanzadores tienen poco o ningún control sobre esta tasa, si se tiene una muestra lo suficientemente grande, si ajustamos por factores de estadio y defensiva. Los nudilleros son una excepción, y los lanzadores realmente malos son una excepción, ya que solo pueden controlar la rapidez con la que se van de la lomita luego de ocho o nueve hits seguidos con pelotas en juego.

Una de las áreas de investigación más interesantes en este momento es qué parte de la variación de año a año en el BABIP de los lanzadores es puro ruído, y si hay alguna señal ahí que pueda ayudar a los equipos a tomar mejores decisiones sobre las transacciones de los lanzadores o su uso.

Por ejemplo, los líderes en BABIP del 2010 al 2012 incluyen algunos jugadores que se vieron ayudados por grandes defensivas, como Jeremy Hellickson y Jered Weaver (un lanzador que provoca elevados en un estadio de elevados que tuvo a Peter Bourjos y Mike Trout detrás de él en muchas ocasiones), pero que además incluye a tipos como Matt Cain, Clayton Kershaw y Justin Verlander, quienes son lanzadores de poder pero que no tienen explicaciones obvias para sus bajos números en el BABIP más allá de su extraordinaria grandeza. ¿Es solo cuestión de suerte, o algo del azar, o ellos son capaces de provocar pequeñas reducciones en sus números de BABIP por el tipo de contacto que provocan?

Hay muchas historias en la red que atacan estos asuntos, y estoy seguro que los departamentos analíticos de cada equipo tendrán sus propios números (excepto los Filis, quienes desean recordarnos que ellos no tienen uno). Mientras tanto, quiero ver el BABIP de un lanzador, este año y luego en pasados años, cuando comience a pensar como evaluar su actuación y luego mirar adelante.