ja_mageia

 

Nossas notícias estão intercaladas com os artigos, ambas na seção de artigos. A maioria das notícias está acessível exclusivamente a cotistas e/ou visitantes registrados. Por favor, dirija-se à seção: Artigos

Início Artigos Qual o time favorito na Copa do Mundo? [Update e comentários finais 11/7]
Qual o time favorito na Copa do Mundo? [Update e comentários finais 11/7] Versão para impressão Enviar por E-mail
Artigos - Investimentos
Escrito por Melao   
Sábado, 12 Junho 2010 06:56

Há muitas maneiras diferentes de tentar responder a essa pergunta. Para começar, faremos uma breve comparação entre dois dos principais sistemas de rating:

 

1) ELO. É baseado no sistema Rasch, concebido nos anos 1930 e usado pela Federação Internacional de Xadrez desde 1970 e em outras modalidades, como Magic The Gathering, Palavras Cruzadas e Gamão. Constitui um método razoavelmente apropriado para rankeamento e rating. Atualmente há vários métodos melhores, como o usado no Sigma Test, o usado por Jeff Sonas em Chessmetrics, o modelo de Birnbaum, entre outros. Estes métodos prestam-se a diversas finalidades, tais como estimação do nível de habilidade em testes psicométricos, exames escolares, performances de competidores ou times em diversas modalidades.

 

2) FIFA. O método adotado pela FIFA, assim como os métodos usados em Boxe, Tênis e outros esportes, embora não sejam tão bem fundamentados, são medianamente eficientes do ponto de vista prático, no sentido de possibilitarem prognósticos razoáveis. Mas ainda estão sensivelmente aquém dos métodos usados em Xadrez, Gamão on-line e Magic.

 

O método proposto por Arpad Elo para o Xadrez, é o melhor oficialmente já adotado por uma federação internacional esportiva, e talvez seja em breve substituído pelo método de Jeff Sonas, que é basicamente igual ao ELO, diferindo apenas por obter valores otimizados para k, de modo a maximizar os acertos nas predições, e por levar em consideração se o jogador teve Brancas ou Pretas. É um pouco mais completo, mas não leva em conta um parâmetro para discriminação, um para sucesso casual, um para variação da discriminação em função do nível de habilidade etc. Embora a supremacia do método de Sonas seja pequena em comparação ao de ELO, ela é notória, o que torna curioso que a FIDE (Fédération Internationale Des Échecs) não tenha adotado prontamente os aprimoramentos sugeridos por Sonas, mesmo após os convincentes artigos que ele publicou na Chess Base, comparando a preditividade do método tradicional de Elo com o método dele, deixando evidente que com a otimização do valor de k e levando em conta quem tem o lance inicial, se consegue prognósticos sensivelmente mais acurados. Os trabalhos de Sonas são conhecidos desde pelo menos 2002, e em 8 anos a FIDE ainda não reformulou o método usado para cálculo de rating. Então é natural que em entidades esportivas de modalidades menos intelectualizadas que o Xadrez, haja uma relutância muito maior em mudar o sistema de rankeamento. Além disso, como já foi constatado pelo físico P. Kirkpatrick, em seu artigo sobre erros nas medidas de performance esportiva, por não levar em conta fatores como a gravidade, pressão etc., em que Kirkpatrick usa o clássico exemplo de que um dardo lançado a uma distância de 16,75 m em Boston requer um impulso inicial igual ao que seria necessário para o mesmo dardo cobrir a distância de 16,71m na Cidade do México. Isso precisaria ser levado em conta no estabelecimento de recordes olímpicos, por exemplo, mas é completamente negligenciado. O artigo de Kirkpatrick foi publicado em 1976 e as principais entidades esportivas foram notificadas, mas nenhuma providência foi tomada até hora para corrigir e equanimizar os resultados. O objetivo principal dos esportes não é determinar quem é o melhor atleta com o máximo de Justiça, mas sim gerar a maior rentabilidade possível a patrocinadores, organizadores e aos próprios atletas. Por isso quanto mais simples for o sistema de medir e comparar resultados, maior será o público capaz de acompanhar, entender e apreciar aquela modalidade. Dentro deste contexto, é natural que federações esportivas prefiram sistemas simples de rankeamento, em vez de sistemas bons e justos.

 

Pois bem, feitas estas considerações, vamos agora comparar o rating usado pela FIFA com o obtido usando o método de Elo e computando jogos desde 1872, conforme consta no site http://www.eloratings.net/ :

 

 

Conforme podemos observar, a média é diferente e a dispersão é diferente, mas o ranking é muito semelhante. A correlação produto momento de Pearson entre estes ratings é acima de 0,9. Os times da Costa do Marfim e Argélia não estão rateados no site que usa sistema ELO, mas estimamos o rating de duas maneiras:

 

A) Média aritmética entre o rating ELO dos times imediatamente acima e abaixo da Argélia no ranking da FIDE e o mesmo procedimento para a Costa do Marfim.

B) Quais ratings precisariam ter a Argélia e a Costa do Marfim para que a correlação entre os ratings FIFA e ELO fosse máxima.

 

Os resultados foram 1707,5 e 1759,5 pelo método A e 1755 e 1735 pelo método B. No primeiro caso, a correlação entre rating da FIFA e ELO fica 0,902 e no segundo caso fica 0,904.

 

Além disso, há um site com rating baseado em apostas. Aparentemente, nesse site só estão rateados times de seleções européias. A correlação do rating desse site com o da FIFA foi 0,527, enquanto a correlação desse site com o rating ELO foi 0,665. A melhor concordância do rating ELO com a bolsa de apostas nos parece um indicativo de que o rating ELO deve ser mais fidedigno. Com base nos diferentes rankeamentos, estimamos as probabilidades de cada time sagrar-se campeão nesta copa. Um cálculo mais elaborado exigiria que tivéssemos acesso a todos os jogos disputados por todas as seleções desde os registros mais antigos, para que pudéssemos calcular cada rating com base nos dados brutos. Sem acesso a estes dados, calculamos com base nas fontes disponíveis.

 

Quando dois times ou dois jogadores (nos casos de modalidades individuais) se enfrentam, a probabilidade de cada jogador vencer a partida é definida por uma fórmula que envolve o rating ELO. Isso possibilita calcular a probabilidade individual de cada time vencer cada jogo e, assim, definir a probabilidade final de cada time ser campeão. Quando o rating se baseia num método diferente do usado por ELO, não há como usar estes números para calcular a probabilidade de cada um vencer ou de ser campeão. Esta é uma das vantagens de se usar o sistema de ELO, ou similares mais sofisticados. No caso de sistema Schuring ou Suíço de emparceiramento, pode-se inclusive simplificar o cálculo da probabilidade de pontos esperados para cada jogador com base na média aritmética dos ratings dos adversários. Mas num sistema com eliminatórias, fica mais complexo.

 

Quando se trata de um match de vários jogos contra um mesmo oponente, ou um torneio com vários jogos contra oponentes diferentes, o sistema ELO não é suficiente, porque o cálculo requer o conhecimento da dispersão em torno da performance média esperada para cada jogador (ou cada time), requer o conhecimento do parâmetro de discriminação etc., sem os quais não se tem como determinar em que medida o aumento na quantidade de jogos no match ou no torneio reduz o fator sorte e aumenta as chances de que o melhor seja vencedor. Exemplo: numa disputa pelo título mundial de Xadrez entre 2 jogadores, A e B, sendo que A tem 2800 de rating ELO e B tem 2650, em que o título fosse disputado em apenas 1 partida, haveria cerca de 70% de probabilidade de o jogador A vencer (sem levar em conta quem tem as Brancas e forçando-os a jogador novamente em caso de empate). Porém se eles jogarem 24 partidas, em vez de apenas 1, qual é a probabilidade de o jogador A vencer a maioria e ser campeão? Certamente é bem maior que 70%, aliás, espera-se que ele faça 70% dos 24 pontos possíveis. A incerteza nestes 70%, bem como a incerteza nos 30% do outro jogador, forneceriam dados úteis para se calcular a probabilidade de cada um deles vencer o match de 24 partidas. Se se conhecesse o parâmetro de discriminação para cada jogador, isso também proveria informações úteis para o cálculo. Mas com base apenas no rating e no número de jogos, não é possível calcular adequadamente a probabilidade de cada jogador vencer o match. Pode-se fazer alguns para tentar estimar probabilidades razoáveis, não mais que isso.

 

No presente caso, fizemos o cálculo em 2 etapas: primeiro tentamos definir os ratings mais fidedignos para cada time, com base nos ratings de diferentes fontes que adotam diferentes métodos. Depois tentamos atribuir incertezas e parâmetros de discriminação. Com isso, acreditamos ter chegado a um ranking razoável, talvez um pouco melhor que o tradicional de ELO e melhor que o da FIFA. Não é tão apropriado quanto o método do Sigma Test, por exemplo, mas conforme já comentamos, precisaríamos ter acesso ao histórico de todos os jogos de todas as seleções para fazer o cálculo de forma mais refinada.

 

Um cálculo mais cuidadoso também poderia levar em conta a latitude, altitude, temperatura média em cada país em comparação ao país sede durante o período do evento. Isso já se mostrou relevante no primeiro jogo, em que o país sede, embora muito mais fraco que o México, teve grande vantagem graças a fatores climáticos e ao curto tempo de adaptação dos hóspedes a esse clima consideravelmente diferente do seu. Porém a tendência é que essa diferença, bem como a adaptação ao fuso horário, diminua ao longo da Copa. O fator psicológico também pode ter sido relevante no jogo da África do Sul, que usou as cores da seleção brasileira, matando de medo meia dúzia dos oponentes antes de entrarem em campo. O fato de jogarem “em casa” também pesa, sobretudo no primeiro jogo. Os comentários sobre estarem usando uma bola de material diferente, que causa a sensação de ter peso diferente, rigidez diferente etc., também pode privilegiar times que estejam habituados a usar esta bola, ou times cujos jogadores tenham mais facilidade para se adaptar à nova bola, um tipo de habilidade que não correlata necessariamente com a competência no futebol propriamente. Se nossos propósitos fossem mais sérios, levaríamos em conta tantos fatores quantos julgássemos relevantes, bem como simularíamos o uso desses fatores em copas passadas para avaliar a predictibilidade de cada método de prognóstico e conferir quais teriam mais acertos nos resultados efetivamente produzidos nas copas antigas, e assim tentar selecionar os fatores realmente relevantes e os métodos mais eficientes. Como esse é um artigo despretensioso, pouco mais que uma brincadeira, damo-nos por satisfeitos com o estudo básico apresentado aqui.

 

Em lugar de usar qualquer das listas de rating disponíveis, calculamos valores ponderados com base em todas as listas, e assim acreditamos ter chegado a valores mais acurados para força real de cada time. Depois de finalizado o novo ranking, constatamos que a correlação de nosso ranking com o da FIFA e o ELO ficou maior do que deles entre si: 0,959 e 0,967, respectivamente. Além disso, ficou em 0,815 com o ranking baseado na bolsa de apostas. Feito isso, tentamos formular uma maneira de determinar em que proporção o aumento no número total de jogos disputados pelo campeão minimiza o fator sorte em comparação à disputa de apenas um jogo. Enfim, o resultado a que chegamos (antes de computar o resultado entre México e África do Sul) foi conforme segue:

 

Em que “P(x)” indica a probabilidade de o time ser campeão. A ordem também indica quais times tem maior probabilidade de chegar às finais, semi-finais etc.

 

UPDATE: 13/6/2010:

 

Fizemos um novo cálculo (sem incluir os resultados dos jogos realizados), levando em conta também os números de vitórias, empates e derrotas obtidos pelos times nas copas anteriores e considerando esses pontos sobre o número de jogos disputados. Com isso chegamos aos resultados da tabela abaixo:

 

A estimativa das probabilidades apresentada na tabela acima foi feita do seguinte modo:

 

1) Foi calculada média e desvio padrão de cada lista de rating e, em seguida, os ratings foram padronizados para que se pudesse obter valores equivalentes em todas as listagens. A unificação foi feita do seguinte modo: R(ELO) = m(x) + [R(x) - m(x)] ´ s(ELO) / s(x), assim um rating FIFA 1565, por exemplo, corresponde a um rating ELO 2072.

2) Foi calculada a média aritmética dos ratings unificados de cada time e este valor considerado a melhor representação para o rating “verdadeiro” de cada time. As listas consideradas para cálculo foram o rating ELO, o ranking da FIFA, o rating do site de apostas e o número de vitórias, derrotas, empates, sobre o total de jogos de cada time e o número total de pontos sem considerar a quantidade de jogos em que os pontos foram obtidos. Computamos 1 para vitória e 0,5 para empate, em vez de 3 e 1.

3) Cada rating foi convertido em um valor numa escala de proporção de potencial por meio da fórmula P = 10(R - 1000)/400 (seria indiferente fazer 10R/400). As proporções entre “potenciais” representam as proporções entre as probabilidades dos times de vencer um jogo individual. Um time com potencial 4.8 se jogar contra um com potencial 1.2 tem 4 vezes mais chances de vencer, ou seja, 80% de probabilidade.

4) Foram somados os potenciais de todos os times e assim calculado o potencial correspondente a 100%. Em seguida foi calculada qual porcentagem corresponde a cada potencial individual. Essa porcentagem indica a probabilidade de cada time ganhar 1 jogo. No caso é necessário um ajuste complementar porque os 4 primeiros colocados disputarão 7 jogos cada ao longo da copa, portanto o fator “sorte/azar” terá menos peso para eles do que se disputassem apenas 1 jogo. Seria necessário conhecer o parâmetro b de discriminização e a incerteza nos ratings para que se pudesse calcular com mais exatidão. No modelo de Rasch, usado por Arpad Elo, não existe o parâmetro b, e no site de ratings Elo de Futebol não são informadas as incertezas nos ratings. Isso inviabiliza o cálculo pelas vias “normais”. Consideramos, então, a quantidade total de jogos a serem disputados pelo campeão, e, com base nos resultados de matchs de Xadrez, estimamos que para n jogos a probabilidade de sucesso do time mais forte é cerca de n0,2 maior do que se fosse disputado apenas 1 jogo. Se não houvesse incerteza nenhuma no valor dos ratings, seria cerca de n0,5. Se não fosse um sistema de eliminatória simples, mas um Schuring, isso também faria diferença. Podemos ordenar os times de acordo com a probabilidade de cada um ser campeão, porém é difícil calcular a probabilidade de cada um ser campeão. Mais um fator a se considerar é que como a Espanha não possui nenhum título, mas tem a segunda melhor seleção com base na maioria dos rankings.

5) O cálculo mais correto (porém bem mais trabalhoso) seria considerar a probabilidade de cada time vencer cada confronto individual e considerar todos os resultados possíveis. Também seria preciso considerar os critérios da FIFA com base em número de gols, já que o sistema ELO atribui 1 ponto para vitória, 0 para derrota e 0,5 para empate, independentemente da quantidade de gols, como a quantidade de gols interfere na expectativa futura, o uso dessa informação tornaria o cálculo mais exato. De qualquer modo, o método descrito acima é uma aproximação bastante satisfatória. É interessante notar que embora o Brasil seja destacadamente o grande favorito, com quase o dobro de probabilidade de sucesso do segundo favorito, ele tem muito menos chances que a soma de todos os demais. Isso condiz com o histórico do Brasil de 19 participações e 5 títulos: cerca de 27% das participações resultaram na conquista de título, embora ele fosse o favorito em quase todas.

 

 

Seria necessário considerar também o fato de que muitos dos jogadores que contribuíram para que cada time reunisse a quantidade de pontos e títulos que possuem hoje, já não participam das competições, embora tenham fomentando o desenvolvimento do esporte em seus respectivos países. Mesmo jogadores recentes, como Romário, Ronaldo Fenômeno, Ronaldinho Gaúcho e Roberto Carlos, que tiveram importante participação na atual classificação do Brasil no ranking da FIFA e ELO, não estão presentes na copa atual, de modo que o rating atribuído às seleções pode ser resquício das proezas de jogadores que já não estejam atuantes. Essa disparidade é parcialmente compensada pelo ranking baseado em bolsa de apostas, que leva em conta estes fatos.

 

UPDATE: 15/6/2010:

Uma forma relativamente simples de "confirmar" a probabilidade aproximada de o Brasil ser campeão é calculando a probabilidade de que ele vença cada um dos prováveis 7 oponentes ao longo da Copa. Para isso vamos supor, em princípio, que os favoritos sempre vençam. Neste caso, as probabilidades de o Brasil vencer todos os 7 jogos seria cerca de 15,02%. Como o Brasil poderia perder um jogo na chave G e ainda assim se classificar, então não precisaria vencer todos os 7 jogos, mas apenas 6, porém nesse caso não seria emparceirado nas fases seguintes com os mesmos opoentes e sim com 2 oponentes mais fortes, de modo que a probabilidade final, aceitando 2/3 dos pontos em sua chave, em vez de 100%, seria 15,68%, não melhorando muito. Considerando que nem sempre os favoritos venceriam, de modo que algumas vezes o Brasil pegaria oponentes mais fracos que os favoritos, e assim teria mais de 15% de probabilidade de vencer todos os 7, o resultado fica assim: como todos os times são fortes e razoavelmente equilibrados, dos 4 jogos após se classificar em sua chave o mais provável é enfrentar 2 favoritos e 2 não-favoritos, isso considerando que todos os não-favoritos somados tenham aproximadamente 50% de probabilidade de vencer os favoritos em cada etapa. Então digamos que ao longo da competição o Brasil tivesse que enfrentar 2 não favoritos, com rating 100 pontos menor que o favorito naquela respectiva fase, então a probabilidade de vencer todos os 7 oponentes seria entre 18,67% e 21,36%, dependendo de quais fossem os não-favoritos evitados. O resultado é muito próximo do valor obtido pelo método de cálculo que adotamos.

Um segredo que julgamos importante revelar é o motivo de o Dunga não ter convocado o Roberto Carlos. Há registros de que Roberto Carlos foi perseguido pela Inquisição por ter sido acusado de bruxaria: http://www.youtube.com/watch?v=-t5MF7NRQh4&feature=related

 

UPDATE: 16/6/2010:

Nosso amigo André Gambaro nos enviou este link em que pesquisadores da UFSCar fizeram previsões sobre a Copa: http://www.copa2010.ufscar.br/tabelaGraf.html. Após o resultado Suíça x Espanha, creio que os resultados estão mais compatíveis com minhas previsões. Porém a maneira como o Brasil jogou contra a Coréia me levou a reconsiderar se o Brasil é de fato o favorito. Numa avaliação subjetiva, com base na qualidade de jogo, diria que talvez a Alemanha ou mesmo o Uruguai possam rivalizar com Brasil e Espanha, apesar de os melhores do Uruguai terem errado chutes e cabeçadas que os Ronaldos acertariam de olhos fechados e joelhos enfermos, mas como o Brasil também está sem os Ronaldos... Vamos aguardar... No início do jogo de hoje, eu estava torcendo pra África do Sul, mas quando eles começaram a lutar Muay Thai e espancar os oponentes, passei a torcer pelo Futebol, modalidade que estava sendo praticada pelo Uruguai. Eu prefiro Muay Thai a Futebol, desde que praticado num ringue apropriado e com regras válidas igualmente para ambos. Achei o resultado justo, especialmente com o terceiro gol faltando segundos pra acabar o jogo, uma vitória da técnica sobre a brutalidade. Fiquei pensando se um time formado por meia dúzia de Ronaldos e um Tafarel em boa forma bateria nos times completos dessa copa. Não sei se um zagueiro faria tanta falta ou se os Ronaldos poderiam se revezar nesse papel.

 

UPDATE: 19/6/2010:

O site da UFSCar tem atualizado regularmente as previsões. Na época que citamos o artigo, o diagrama de caixa que usavam era este:

Em que a Espanha ainda estava em primeiro lugar como favorita. Agora que a Alemanha perdeu, provavelmente mudarão a nova tabela em que colocaram a Alemanha no topo (abaixo) e colocarão a Argentina como favorita.

Um detalhe (sem muita importância) é que o cabeçalho apropriado deveria ser "Probabilidades de ser campeão". O termo "chance" deve ser representado como uma fração, algo com 1 chance em 20 (= 5% de probabilidade).

 

UPDATE: 27/6/2010:

Considerando os resultados obtidos até agora, as probabilidades de cada time ser campeão são conforme a tabela abaixo (em verde os times que já disputaram sua partida das oitavas):

 

Se compararmos as previsões da UFSCar com a nossa, podemos notar como maior diferença a volatilidade. Nossas previsões se mantêm quase iguais às iniciais, com base principalmente no rating, que não se altera sensivelmente com poucos novos resultados, cujos resultados decorreram principalmente do fator sorte/azar. Isso pode ser constatado pela baixa correlação ordinal de Spearman entre a classificação no ranking e a classificação nas chaves: 0,30, indicando grande quantidade de “zebras” ou grande participação do fator “sorte” em comparação ao fator “habilidade”. O efeito não tem afetado um ou outro time isolado, mas tem afetado globalmente todos os times, fato que se manifesta na baixa correlação entre resultados obtidos e esperados, que em condições “normais” seria cerca de 0,65, em vez de 0,30. Isso pode ter sido causado pela bola, conforme comentamos no início. Sendo a bola diferente da tradicional, os times de menor habilidade devem sofrer comparativamente menos com esse efeito, devido à menor acurácia de suas jogadas. A conseqüência é uma redução na diferença de performance entre os melhores e os piores times.

 

 

UPDATE: 30/6/2010:

Definidos os 8 times finalistas, com uma quantidade muito menor de possibilidades diferentes, pudemos dar uma abordagem mais exata e considerar as probabilidades em cada confronto individual atual e cada possível confronto futuro. Além disso, calculamos também com base no rating médio dos oponentes, sem levar em conta os oponentes possíveis e a probabilidade dos emparceiramentos. E calculamos com base na força média dos oponentes, sem levar em conta os oponentes possíveis e a probabilidade dos emparceiramentos. Os resultados são apresentados a seguir, respectivamente com P1(x), que é o método principal e provavelmente o mais acurado. P2(x) e P3(x). Tanto o Brasil quanto a Espanha foram muito beneficiados porque, entre 3 jogos restantes, em pelo menos 1 pegarão um oponente teoricamente fraco, enquanto Alemanha e Argentina, se se mantiverem, terão 3 oponentes fortes, o que reduz consideravelmente as chances destes em comparação às do Brasil e da Espanha. O mais beneficiado é o Brasil, já que não tem o Brasil pela frente como possível adversário. :-)

 

Após o jogo entre Brasil e Holanda, as probabilidades do que vencer aumentarão em relação aos demais numa proporção maior do que a redução do número de sobreviventes, porque nos dois jogos seguintes terão 1 fraco e 1 forte a enfrentar, enquanto os demais só terão oponentes fortes a enfrenta. Se o Brasil vencer a Holanda, ficará com cerca de 53,13% de probabilidade de ser campeão (dependerá de quais serão os outros semi-finalistas), ou seja, terá sozinho mais chances do que os outros 3 times somados.

Tanto em nossa primeira previsão quanto na primeira da UFSCar, acertamos 5 entre os 8 times que chegaram às quartas de final.

 

 

Update final, 11/7/2010:

 

Terminou a Copa, e o segundo de nossa lista inicial de favoritos sagrou-se campeão. A correlação para os 4 primeiros classificados com a ordem de nossa última tabela foi rhô=0,80 e r=0,89 com as probabilidades de nossa lista. Com nossa primeira tabela também foi r=0,89. A correlação entre a classificação final e a primeira previsão dos professores do Centro de Estudos do Risco do Departamento de Estatística da Universidade Federal de São Carlos foi r=0,98 e rhô=1,00. Na última previsão da UFSCar para oitavas de final, a correlação com o resultado foi r=0,63 e rhô=0,40. Mesmo na última previsão, faltando apenas decisões entre Alemanha e Uruguai para terceiro lugar, e o título entre Espanha e Holanda, eles ainda atribuíram maior probabilidade de sucesso à Holanda. A essa altura nossa correlação ordinal foi rhô=1,00, enquanto a deles foi rhô=0,80. Seguem as tabelas que eles removeram do site:

 

 

Embora eles não tenham divulgado o método utilizado, é possível identificar vários prováveis procedimentos inapropriados nos cálculos, sendo que os dois principais foram a supervalorização de resultados mais recentes, o que podemos perceber pela volatilidade com que a ordem da tabela deles se modificava com apenas um ou poucos novos jogos, enquanto nossa ordem se manteve quase inalterada até o final, mudando apenas as probabilidades conforme a quantidade de competidores mudava. Quanto informações novas eles utilizavam, pior ficava a previsão, quando deveria ser o contrário se usassem um método apropriado.  Uma previsão que começou com correlação perto de 1, terminou em 0,63. Aparentemente não usaram Teoria de Resposta ao Item, nem algo semelhante, o que teria sido a ferramenta adequada a esse tipo de cálculo. Se tivessem usado, o erro deles teria sido atribuir um peso exagerado ao k de ELO, em que poucos jogos recentes interfeririam muito na reavaliação das probabilidades, destoando da realidade. Outro problema é que aparentemente atribuíram peso excessivo ao número de gols, sendo que o mais correto seria não levar em conta a quantidade de gols ou atribuir um peso bem pequeno a isso, determinando esse peso com base no histórico de jogos. Além disso, também partiram de uma tabela inicial que usa principalmente dados recentes. Um dos motivos de não ter tentado estimar o efeito da ausência dos Rs é que eu não tenho idéia de como quantificar isso. Talvez considerando que o Ronaldo marcou sozinho, em 2002, quase o dobro dos gols do time inteiro da Espanha, em 2010, ajudasse a fazer uma previsão de que sem o Ronaldo o Brasil deveria cair rapidamente. Enfim, não sabia quantificar e acabei não incluindo essa informação no cálculo, embora tenha comentado sobre isso desde o início. Também acho importante deixar claro que minha correlação com os resultados finais ficou melhor que da UFSCar principalmente por sorte, porque a quantidade de jogos foi muito pequena para se que pudesse ter um resultado final representativo das forças dos times. Se fossem disputados 50 ou 100 jogos por time, provavelmente minha correlação subiria para cerca de 0,95 +/- 0,03 e a da UFSCar ficaria em torno de 0,80 +/- 0,05. E nesse caso realmente eu chegaria mais perto do resultado final por ter usado um método melhor. Aliás, o resultado final chegaria mais perto da previsão teórica que tivesse adotado o melhor modelo.

 

Por minha parte, houve dois erros: não levei em conta o ranking mais importante que definiria o campeão, que é baseado no “valor” monetário das seleções: http://www.futebolfinance.com/o-valor-das-seleccoes-no-mundial-fifa-2010 . Poderia ter usado o mesmo critério para o número de pontos em copas anteriores e convertido estes valores e rating, e incluído estes ratings no calculo, o que tornaria as previsões mais exatas. Na verdade, esse ranking só posicionaria corretamente a Espanha acima do Brasil (se considerado isoladamente), mas não contribuiria muito para melhorar a previsão das demais classificações. Ao considerar em conjunto com outros ratings, reduziria a diferença entre Brasil e Espanha e tornaria os cálculos um pouco mais precisos, talvez deixando a correlação em 0,90. Outro erro foi não ter tentado estimar o desastre causado ao time do Brasil pelo Dunga, que não levou os melhores jogadores. Tanto o rating ELO quanto o FIFA alcançados pelo Brasil foram em grande parte graças à participação de jogadores que não estavam presentes na Copa. Várias vezes a ausência dos Ronaldo foi sentida. Até mesmo o time campeão sentiu tremendamente a ausência de um Ronaldo, Romário ou um Forlan. No jogo entre Espanha e Alemanha, cheguei a comentar que a Espanha era favorita, porém se a Alemanha abrisse placar de 1 x 0, seria muito mais difícil a Espanha reverter do que se a Espanha abrisse 1 x 0 e a Alemanha precisasse reverter. A Alemanha é muito mais eficiente nas finalizações, e não fosse pela notável habilidade do goleiro da Espanha, provavelmente não teriam ido tão longe.

 

Achei interessante a Espanha ter começado perdendo o primeiro jogo do grupo, mas deu uma virada e sagrou-se campeã, mesmo sendo um time que não sabe finalizar e que os artilheiros acham o gol do adversário estreito demais e baixo demais, um time sem estrelas, exceto o goleiro, que a meu ver foi um dos melhores, ao lado dos goleiros da Alemanha e Holanda (quase incluiria os de Gana e Brasil). Mas a sinergia do grupo era muito boa, faziam passes bonitos, harmoniosos e precisos, integrando-se como um organismo em campo, enquanto os demais times eram comparativamente constituídos por jogadores mais individualistas. A reviravolta do mau início me fez lembrar do primeiro torneio internacional fechado de que participei, em que comecei perdendo 2 e empatando 1 das 3 primeiras partidas, que além dos pontos em si, causou um impacto psicológico considerável, inicialmente uma sensação de abatimento e desmotivação, mas logo em seguida um aumento enorme na gana de ganhar, e nas 11 partidas seguintes perdi apenas mais 1 e ainda finalizei e terceiro lugar no torneio, sendo o único a ter obtido uma vitória sobre o campeão, que foi aliás a melhor partida do torneio e uma das melhores partidas do mundo naquele ano, com sacrifícios de uma Torre, dois Bispos, um Cavalo e finalizando com sacrifício de Dama, citada numa variante da partida do campeão mundial Alexander Khalifmann no Sahosvki Informator 70, publicada na Chess Base Magazine, em Super Ajadrez Espano-Americano e outras fontes. Essas vitórias de virada têm um sabor especial, porque além da a mudança de ânimo contrastante produzir um prazer diferente, ao longo do evento se pode assistir também à mudança de ânimo dos que estão torcendo contra, que vão definhando até se apagar. Nestas situações também se pode reconhecer os verdadeiros amigos, que continuam dando apoio nos momentos mais difíceis, enquanto a maioria simplesmente se afasta até que a situação melhore, e depois que o pior passa, voltam a elogiar. Naquela época, lembro-me de que após minha derrota na terceira partida, o Georges Vittorato me disse que o campeão mundial Mihail Tal freqüentemente passava por isso, com uma ou duas derrotas seguidas no início, mas no final acabava vencendo o torneio. A diferença é que o Tal era sobre-humano (eu me recuso a escrever “sobreumano” e a deixar de usar trema, alguém deveria enviar para a fogueira quem fez essa reforma). Embora eu não tenha nenhuma simpatia especial por quase nenhum país (acho que se a Ilha de Lesbos fosse um país, eu simpatizaria), mas entre os não-mitológicos, acho que meu favorito é o Japão, ou melhor, o povo japonês. O pais que me parece ser um dos melhores, em aspectos geográficos, geológicos, climáticos é talvez o Brasil. Em aspectos sociais e culturais, talvez a Suíça, talvez a Finlândia, talvez o Japão, acho difícil avaliar.

 

Há pouco comentaram que o melhor jogador eleito na Copa foi o Forlan. Eu havia dito isso à minha mãe depois que ele quase fez um gol na cobrança de escanteio, não tentou na segunda cobrança de escanteio, alguns minutos depois, e marcou um gol belíssimo pingando a bola com força no chão e depois subindo forte, um dos mais bonitos da Copa. Inclusive no último chute na trave, que poderia ter sido decisivo, ele foi extremamente preciso, mesmo cansado e sobre extrema tensão. Nos jogos anteriores ele cobrou faltas certeiras, fez passes precisos e importantes, e sempre estava perto da bola no ataque e na defesa, mas foi este último jogo e achei decisivo para considera-lo o melhor. Houve uma Copa (acho que 1982 ou 86) em que o Platini, que era considerado o melhor do mundo antes de iniciar a Copa, na cobrança de um pênalti (ou falta, não me recordo), quase acertou o holofote. O Forlan pelo menos acertou a trave. Depois que disseram que ele foi eleito pela FIFA o melhor jogador da Copa, mudei de idéia em minha avaliação. Ele não é um jogador, é um artista. Adolf Anderssen, que foi o melhor jogador do mundo de Xadrez entre 1851 e 1858, estava perdendo por 7x2 seu match contra o jovem Paul Morphy, de 21 anos, considerado por Bobby Fischer o maior talento natural da história da humanidade, talvez comparável a Da Vinci ou Newton. Então, um dos admiradores de Anderssen perguntou a ele por que não estava fazendo aqueles ataques brilhantes com arremates geniais que o consagraram, ao que Anderssen respondeu: “estou tentando, mas ele não me permite”. Com exceção do Ronaldinho Gaúcho, não vi outros futebolistas fazendo jogadas tão bonitas como o Forlan, ao enfrentarem adversários fortes.


 

Para quem tiver interesse em conhecer mais sobre os métodos usados nesses cálculos, sugerimos estes sites:

 

http://www.sigmasociety.com/artigos/norma_setembro_2003.pdf

http://www.sigmasociety.com/artigos/norma_set_2004.pdf

http://www.sigmasociety.com/artigos/st_2006.pdf

http://www.eloratings.net/

http://www.soccer-rating.com/

http://pt.fifa.com/worldfootball/ranking/lastranking/gender=m/fullranking.html

http://www.sigmasociety.com/sigma_teste/sigma_sigma_teste.asp

http://www.eloratings.net/system.html

http://edres.org/irt/