Normalização é bom para usar quando você sabe que a distribuição de seus dados não segue uma distribuição gaussiana. … A padronização, por outro lado, pode ser útil nos casos em que os dados seguem uma distribuição gaussiana.
Devo usar normalização ou padronização?
A normalização é útil quando seus dados têm escalas variadas e o algoritmo que você está usando não faz suposições sobre a distribuição de seus dados, como k-vizinhos mais próximos e redes neurais artificiais. Padronização pressupõe que seus dados tenham uma distribuição Gaussiana (curva de sino).
Padronização é o mesmo que normalização?
No mundo dos negócios, "normalização" normalmente significa que o intervalo de valores é "normalizado para ser de 0.0 a 1,0". "Padronização" normalmente significa que o intervalo de valores é "padronizado" para medir quantos desvios padrão o valor está em relação à média.
É sempre bom normalizar os dados?
Ao normalizar, você está, na verdade, jogando fora algumas informações sobre os dados, como os valores máximo e mínimo absolutos. Então, não existe regra prática. Como outros disseram, a normalização nem sempre é aplicável; por exemplo. do ponto de vista prático.
Quando você não deve normalizar os dados?
Algumas boas razões para não normalizar
- As junções são caras. A normalização de seu banco de dados geralmente envolve a criação de muitas tabelas. …
- Design normalizado é difícil. …
- Rápido e sujo deve ser rápido e sujo. …
- Se você estiver usando um banco de dados NoSQL, a normalização tradicional não é desejável.