Para resumir, geralmente se a distribuição dos dados for assimétrica para a esquerda, a média é menor que a mediana, que geralmente é menor que a moda. Se a distribuição dos dados for assimétrica para a direita, a moda geralmente é menor que a mediana, que é menor que a média.
Por que a mediana é menos afetada por dados distorcidos?
Por que a mediana é menos afetada por dados distorcidos do que a média? No entanto, à medida que os dados se tornam distorcidos, a média perde sua capacidade de fornecer a melhor localização central para os dados, porque os dados distorcidos os estão arrastando para longe do valor típico.
Por que a mediana é melhor para dados distorcidos?
Para distribuições que têm outliers ou são assimétricas, a mediana é frequentemente a medida de tendência central preferida porque a mediana é mais resistente a outliers do que a média… Observe que a média é puxada na direção da assimetria (ou seja, na direção da cauda).
Quando inclinado para a direita, a média é mediana?
Para uma distribuição assimétrica à direita, a média é normalmente maior que a mediana Observe também que a cauda da distribuição no lado direito (positivo) é maior do que no lado direito lado esquerdo. A partir do diagrama de caixa e bigode, também podemos ver que a mediana está mais próxima do primeiro quartil do que do terceiro quartil.
Como a assimetria afeta os dados?
Efeitos da assimetria
Se houver muita assimetria nos dados, muitos modelos estatísticos não funcionam, mas por quê. Assim, em dados distorcidos, a região da cauda pode atuar como um outlier para o modelo estatístico e sabemos que os outliers afetam negativamente o desempenho do modelo, especialmente os modelos baseados em regressão.