Uma plataforma que vai te ajudar a entender um pouco mais de economia.

Com o fim da Copa do Mundo foi divulgada a classificação das 32 seleções participantes. Podemos então verificar como algumas características das equipes se correlacionam com seu desempenho no torneio (medido pela posição na classificação). Trata-se de uma oportunidade de aplicarmos conceitos de estatística a um evento bem atual. Veja mais aqui  e na playlist abaixo sobre noções de estatística (e, em particular, sobre as técnicas que utilizaremos no texto).

Antes de tudo, um aviso: os resultados que mostraremos a seguir são meramente correlações. Eles nos dizem como duas variáveis se movem conjuntamente nos dados. Mas não dá para afirmar nada quanto a relações de causa-efeito. Se duas variáveis X e Y tendem a andar juntas, elas apresentam correlação positiva. Se quando uma sobe, a outra tende a descer, a correlação é negativa. Não é possível afirmar, com base nisso, que um aumento em X levará a um aumento/diminuição em Y (ou vice-versa).

Uma forma de visualizar a correlação entre duas variáveis é o diagrama de dispersão. Abaixo apresentamos um diagrama de dispersão em que relacionamos a posição da seleção na Copa (eixo vertical) ao valor de mercado dos atletas convocados (eixo horizontal). Cada ponto corresponde a um país. A classificação da seleção está em ordem inversa: quanto mais alto o valor no eixo (e mais baixo o ranking), melhor o desempenho na Copa.

grafico-folha-16.07.0

A linha verde é a reta que melhor se ajusta aos dados. Note que ela é ascendente, o que significa que há uma correlação positiva entre as variáveis. Seleções mais caras apresentaram, em média, melhor desempenho. Claro que a relação não é perfeita. Note a Croácia, por exemplo, bem acima da reta – seu desempenho é muito melhor do que o previsto pelos dados de valor de mercado. E a Alemanha, bem abaixo. Mas a correlação é relativamente forte (ou seja, o ajuste da reta à nuvem de pontos não é ruim).

O coeficiente de correlação é um índice que mede o grau de associação linear entre duas variáveis. Ele é um número entre -1 e 1. Quanto mais próximo de 1, mais juntamente tendem a andar as duas variáveis. Se ele está próximo de -1, elas também andam juntas, mas em sentido contrário (quando uma sobe, a outra tende a descer).

No gráfico acima, o coeficiente de correlação é aproximadamente 0,6.

Uma curiosidade com relação a esses dados: a seleção mais cara é a França (justamente a campeã), e a mais barata a do Panamá (última colocada).

Calculamos correlações do desempenho com outras duas variáveis: a altura média e a idade média dos jogadores de cada seleção. A seguir exibimos o gráfico do desempenho contra a altura média (em centímetros). A linha de tendência é ascendente, mas há muito ruído. Ela explica muito pouco da variação nos dados.
grafico-folha-16.07.2
De fato, o coeficiente de correlação é bem próximo de zero. Aliás, estatisticamente, nem mesmo é possível distinguir esse valor de zero. Não dá para afirmar, portanto, que seleções mais altas se deram melhor no Mundial.

Finalmente, apresentamos a correlação entre classificação e idade média. Nesse caso a reta de tendência é descendente, ou seja, há correlação negativa entre as duas variáveis. Seleções mais jovens, em média, tiveram desempenho melhor. Essa correlação é mais forte do que a anterior, porém não explica muito da variação nos dados. O coeficiente de correlação estimado é igual a -0,2.

grafico-folha-16.07.1

Nos exercícios acima estimamos relações entre duas variáveis. Mas há técnicas que nos permitem levar em conta o efeito conjunto de diversas variáveis sobre o desempenho das seleções. Se relacionarmos a classificação das seleções às três variáveis simultaneamente (valor do elenco, altura média e idade média), a única que se correlaciona com o desempenho das seleções é o valor de mercado dos jogadores. O efeito das outras duas não é diferente de zero, em termos estatísticos.

Fontes dos dados:

Classificação final da Copa do Mundo de 2018

Valor de mercado dos jogadores convocados para as seleções (Os dados foram coletados em 30/6. Hoje os valores já mudaram, provavelmente em função do resultado da Copa)

Altura média

 

Idade média

 

Para ficar por dentro do que rola no Por Quê?, clique aqui e assine a nossa Newsletter.

Siga a gente no Facebook e Twitter! Inscreva-se no nosso canal no YouTube! E curta as nossas fotos no Instagram :)

 

Balanço estatístico da Copa de 2018

Com o fim da Copa do Mundo foi divulgada a classificação das 32 seleções participantes. Podemos então verificar como algumas características das equipes se correlacionam com seu desempenho no torneio (medido pela posição na classificação). Trata-se de uma oportunidade de aplicarmos conceitos de estatística a um evento bem atual. Veja mais aqui  e na playlist abaixo sobre noções de estatística (e, em particular, sobre as técnicas que utilizaremos no texto). Antes de tudo, um aviso: os resultados que mostraremos a seguir são meramente correlações. Eles nos dizem como duas variáveis se movem conjuntamente nos dados. Mas não dá para afirmar nada quanto a relações de causa-efeito. Se duas variáveis X e Y tendem a andar juntas, elas apresentam correlação positiva. Se quando uma sobe, a outra tende a descer, a correlação é negativa. Não é possível afirmar, com base nisso, que um aumento em X levará a um aumento/diminuição em Y (ou vice-versa). Uma forma de visualizar a correlação entre duas variáveis é o diagrama de dispersão. Abaixo apresentamos um diagrama de dispersão em que relacionamos a posição da seleção na Copa (eixo vertical) ao valor de mercado dos atletas convocados (eixo horizontal). Cada ponto corresponde a um país. A classificação da seleção está em ordem inversa: quanto mais alto o valor no eixo (e mais baixo o ranking), melhor o desempenho na Copa. grafico-folha-16.07.0 A linha verde é a reta que melhor se ajusta aos dados. Note que ela é ascendente, o que significa que há uma correlação positiva entre as variáveis. Seleções mais caras apresentaram, em média, melhor desempenho. Claro que a relação não é perfeita. Note a Croácia, por exemplo, bem acima da reta – seu desempenho é muito melhor do que o previsto pelos dados de valor de mercado. E a Alemanha, bem abaixo. Mas a correlação é relativamente forte (ou seja, o ajuste da reta à nuvem de pontos não é ruim). O coeficiente de correlação é um índice que mede o grau de associação linear entre duas variáveis. Ele é um número entre -1 e 1. Quanto mais próximo de 1, mais juntamente tendem a andar as duas variáveis. Se ele está próximo de -1, elas também andam juntas, mas em sentido contrário (quando uma sobe, a outra tende a descer). No gráfico acima, o coeficiente de correlação é aproximadamente 0,6. Uma curiosidade com relação a esses dados: a seleção mais cara é a França (justamente a campeã), e a mais barata a do Panamá (última colocada). Calculamos correlações do desempenho com outras duas variáveis: a altura média e a idade média dos jogadores de cada seleção. A seguir exibimos o gráfico do desempenho contra a altura média (em centímetros). A linha de tendência é ascendente, mas há muito ruído. Ela explica muito pouco da variação nos dados. grafico-folha-16.07.2 De fato, o coeficiente de correlação é bem próximo de zero. Aliás, estatisticamente, nem mesmo é possível distinguir esse valor de zero. Não dá para afirmar, portanto, que seleções mais altas se deram melhor no Mundial. Finalmente, apresentamos a correlação entre classificação e idade média. Nesse caso a reta de tendência é descendente, ou seja, há correlação negativa entre as duas variáveis. Seleções mais jovens, em média, tiveram desempenho melhor. Essa correlação é mais forte do que a anterior, porém não explica muito da variação nos dados. O coeficiente de correlação estimado é igual a -0,2. grafico-folha-16.07.1 Nos exercícios acima estimamos relações entre duas variáveis. Mas há técnicas que nos permitem levar em conta o efeito conjunto de diversas variáveis sobre o desempenho das seleções. Se relacionarmos a classificação das seleções às três variáveis simultaneamente (valor do elenco, altura média e idade média), a única que se correlaciona com o desempenho das seleções é o valor de mercado dos jogadores. O efeito das outras duas não é diferente de zero, em termos estatísticos. Fontes dos dados: Classificação final da Copa do Mundo de 2018 Valor de mercado dos jogadores convocados para as seleções (Os dados foram coletados em 30/6. Hoje os valores já mudaram, provavelmente em função do resultado da Copa) Altura média   Idade média   Para ficar por dentro do que rola no Por Quê?, clique aqui e assine a nossa Newsletter.
Siga a gente no Facebook e Twitter! Inscreva-se no nosso canal no YouTube! E curta as nossas fotos no Instagram :)


 
Para ficar por dentro do que rola no Por Quê?clique aqui e assine a nossa Newsletter.

Siga a gente no Facebook e Twitter!
Inscreva-se no nosso canal no YouTube!
Curta as nossas fotos no Instagram!

O que você achou desse texto?

*Não é necessário cadastro.

Avaliação de quem leu:

Avalie esse texto Não é necessário cadastro

A plataforma Por Quê?Economês em bom português nasceu em 2015, com o objetivo de explicar conceitos básicos de economia e tornar o noticiário econômico acessível ao público não especializado. Acreditamos que o raciocínio econômico é essencial para a compreensão da realidade que nos cerca.

Iniciativa

Bei editora
Usamos cookies por vários motivos, como manter o site do PQ? confiável ​​e seguro, personalizar conteúdo e anúncios,
fornecer recursos de mídia social e analisar como o site é usado. Para maiores informações veja nossa Política de Privacidade.