Estatísticas avançadas no futebol

Entenda como a exploração dos dados está mudando tudo o que sabemos sobre um dos esportes mais populares do mundo


Por Daniel Endebo

28 de junho de 2023

Estatísticas avançadas no futebol

Em 2004, Michael Lewis escreveu um livro que mudaria para sempre a história dos esportes. “Moneyball”, que eventualmente virou filme estrelado por Brad Pitt, é um best seller esportivo e conta a história de como o dirigente Billy Beane, do Oakland Athletics, da Major League Baseball (MLB), procurou nas estatísticas a solução para a disparidade econômica entre seu time e as maiores franquias da liga. 

Além de colocar o esporte no radar de fãs casuais, a obra joga luz sobre a busca por vantagens competitivas – noção que se aplica não apenas no baseball, mas em todos os esportes. De lá pra cá, vimos o surgimento de estatísticas avançadas em outros esportes (procure por VORP ou PER no site da NBA, por exemplo), um movimento bastante alinhado com o que se vê no mercado de trabalho, inclusive, onde tentar melhorar eficiência e resultados através dos dados virou mantra para grandes empresas. 

O livro capturou interessados de vários nichos justamente por se aprofundar em um debate generalista; você não precisa ser fã – nem mesmo saber as regras – de baseball para compreender (e se apaixonar por) as ideias do autor. Basta se interessar por números, boas histórias e tentar transportar um pouco do cenário para sua própria realidade e voilá, estamos diante de uma obra-prima da indústria esportiva. 

Buscar vantagem competitiva é algo que existe desde sempre nos esportes. Nem sempre vai parecer científico, como soa em Moneyball, mas tentar ser melhor que o outro é parte fundamental da competição – e nem todos temos as mesmas armas. Um clube de futebol que explora um mercado mais periférico procura grandes talentos, ainda fora do radar dos maiores clubes do mundo, a um custo mais acessível do que no mercado interno, por exemplo. Um clube que investe em estrutura e desenvolvimento de jovens, procura alavancagem futura com isso. Exemplos não faltam. 

Só que o futebol não é um esporte estatístico, por excelência. Os principais “eventos” de um jogo acontecem poucas vezes na partida e existe um elemento de “aleatoriedade” no esporte que não se vê em outras modalidades. E, para dificultar ainda mais a tarefa, o futebol não tem uma liga unânime e globalmente reconhecida como “a mais forte do mundo”, como acontece com a NFL ou NBA, por exemplo. Então, como o Moneyball se conecta com o futebol? 

Transformação da indústria 

Ao longo desse século, a forma como se consome futebol vem se transformado pelo mundo. É cada vez mais comum assistir jogos em duas telas, acompanhando a partida numa e comentários em uma rede social noutra; ter aplicativo com notificações que avisem eventos do jogo; apostar em eventos das partidas que você irá (ou não) assistir – mas que te importa; jogar todos os tipos de games relacionados ao esporte, seja simulador de técnicos, jogo de futebol mesmo, gestão de clube ou fantasy game. 

Essas mudanças abriram portas para diversas oportunidades de negócio e despertou interesses variados em boa parte do público. Um deles foi o gosto pelas estatísticas e a tentativa de encontrar respostas através delas. 

Claro, tem gente interessada em usar números brutos para discutir quem é o melhor da história na rede social. Mas há sim uma crescente quantidade de pessoas interessadas em explorar essa temática, inclusive profissionalmente. 

Os últimos 5 anos, em especial, foram muito prolíficos para os fãs de números. Surgiram cursos de formação especializada, clubes de todos os cantos passaram a olhar com mais carinho para a necessidade de ter profissionais qualificados, que sejam capazes de ler além dos números e manter seus clubes competindo, novas ferramentas surgiram no mercado. E o desenvolvimento desse ecossistema permitiu a construção de novos modelos estatísticos para se olhar o jogo – alguns dos quais olharemos agora. 

xG: Gols esperados 

O indicador queridinho do momento. O xG – sigla para “Expected Goals” ou “gols esperados” – foi o primeiro passo real que o universo do futebol deu para sair das discussões básicas e tentar interpretar eventos centrais do jogo sob uma outra ótica. É um modelo relativamente novo, com conceito universal e mensuração artesanal, e se propõe a avaliar o sucesso ofensivo de um time time através da “qualidade das chances criadas”. 

Para entender melhor seu conceito: para cada finalização realizada por um time, é atribuído um valor, que vai de 0,01 a 0,99. Esse valor conta ao público a probabilidade de que essa dada finalização seja convertida em gol – quanto mais próximo de 1, maior a “qualidade da chance”; quanto mais próximo de 0, mais improvável é sua conversão. O cálculo desse número mágico leva em consideração um monte de variáveis, como: 

  • Posição do campo onde foi realizada a finalização 
  • Jogador que realizou a finalização 
  • Forma como a finalização foi realizada (pé bom, cabeça, pé ruim) 
  • Havia ou não havia marcação? 

Para ilustrar ao leitor: você é capaz de saber que o famoso “gol que o Deivid perdeu”, num Flamengo e Vasco, é um “gol feito perdido”, independentemente de probabilidade; o jogador finaliza quase dentro gol, próximo à trave, já sem goleiro e marcação, com o seu pé bom. Se pensarmos numericamente, esse é um lance que sairia gol em, sei lá, 98 de 100 chances, por exemplo. Então é razoável atribuir a esse lance um xG de 0,98. 

Já no famoso “gol de falta do Ronaldinho Gaúcho contra a Inglaterra, na Copa de 2022”, a chance de aquilo se repetir é muito baixa: a falta é extremamente distante, há pelo menos 15 jogadores entre a bola e o gol, o ângulo para o chute é ruim. Em 100 chances como aquela, talvez 3 virassem gols. Um xG hipotético de 0,03. 

Mas qual dos dois lances virou gol? 

O modelo, claro, tem suas imperfeições. O objetivo desse indicador não é somar as probabilidades de todos os chutes de um time no jogo e concluir que “time A deveria vencer time B pois teve maior xG”. O objetivo é dar ao espectador uma ideia de quão boas foram as chances construídas – e, muitas vezes, esse número retratará o resultado da partida. 

Ele também pode ser usado para interpretações individuais: jogadores que consistentemente finalizam lances com alto xG são atletas que encontram bons espaços para tanto – seja através de movimentação, de criação de espaço para si via dribles. 

Atualmente, é possível encontrar esse indicador em sites e aplicativos, como understat, Footure e SofaScore. 

xGoT: Gols esperados com finalizações no alvo 

Uma evolução da estatística xG é a xGoT. Seu nome significa “Expected Goals on Target”, algo como “gols esperados com finalizações no alvo”. E a maior diferença dessa estatística para a anterior é que, aqui, leva-se em consideração não apenas a qualidade da oportunidade criada, mas também um peso ajustado para ONDE a bola foi quando a finalização vai ao gol. 

Pensando no exemplo da falta do Ronaldinho Gaúcho: o xG pode me dizer que aquele lance é improvável de virar gol, certo? O xGoT, porém, me diz que, DADO QUE aquela finalização foi ao gol quase no ângulo, a probabilidade dela ser gol é muito maior do que os hipotéticos 0,03 comentado no tópico anterior. A existência dessa métrica é tentar corrigir essas possíveis distorções, dando um peso mais realista ao número final e a possibilidade de interpretação dos dados de maneira mais fiel possível ao que aconteceu no jogo. 

Individualmente, podemos usar o indicador para entender a capacidade de finalização/repertório de um determinado atacante e também usar para avaliar a capacidade dos goleiros de performar além do esperado, dada a qualidade das chances criadas. 

Esse indicador é bem menos popular que o xG e é mais difícil de encontrá-lo disponível no mercado. Opta/Stats Perform e Wyscout são ferramentas indicadas para quem quer explorar essas informações. 

Outras estatísticas 

Se você é um curioso por interpretar o jogo através de números, vale a pena checar o site Football Reference (www.fbref.com). Lá, é possível encontrar outros dados que ainda são pouco explorados pelos canais convencionais, como: 

  • xA (“assistências esperadas”) 
  • gCA (“ações para criações de gols”) 
  • sCA (“ações para criação de chutes”) 
  • Ações progressivas com a bola 
  • Etc. 

Como o site te permite comparar atletas e fazer filtros por temporada e competição, por exemplo, é possível entender o impacto individual de um jogador dentro de um contexto. É possível identificar quais são os indicadores que tornam especial um determinado atleta e mapear potenciais substitutos para ele. 

O futuro 

Esse é um momento especial para o esporte. Nunca houve tanta informação para trabalhar e interpretar no jogo. Olhar para as estatísticas básicas, como gols e chutes, não é mais suficiente para termos o melhor extrato possível das partidas. 

Há aqui uma grande oportunidade. Para fãs, é um espaço para consumir o esporte por outra ótica e, inclusive, tomar decisões em relações a games e apostas. Para profissionais da área, é necessário acompanhar a evolução dos números e – por que não? – desenvolver novas visões que te permita ter vantagens competitivas contra seus concorrentes. Afinal de contas, esse era o propósito original do Moneyball.