Quando usar o acumulador?

Índice:

Quando usar o acumulador?
Quando usar o acumulador?

Vídeo: Quando usar o acumulador?

Vídeo: Quando usar o acumulador?
Vídeo: Acumulador Compulsivo – Como ajudar um acumulador? (Disposofobia ou síndrome de Diógenes) 2024, Outubro
Anonim

Acumuladores são variáveis que são apenas “adicionadas” por meio de uma operação associativa e, portanto, podem ser suportadas de forma eficiente em paralelo. Eles podem ser usados para implementar contadores (como em MapReduce) ou somas. O Spark suporta nativamente acumuladores de tipos numéricos, e os programadores podem adicionar suporte para novos tipos.

Por que estamos usando o acumulador?

Acumuladores hidráulicos são usados em uma ampla variedade de indústrias para armazenar energia; manter a pressão; amortecer vibrações, pulsações e choques; e muito mais. Armazenamento de Energia – Os acumuladores podem aceitar, armazenar e liberar energia na forma de fluido pressurizado para melhorar a eficiência do seu sistema hidráulico.

Qual é a diferença entre transmissão e acumulador no Spark?

A principal diferença entre uma variável de broadcast e um acumulador é que enquanto a variável de broadcast é somente leitura, o acumulador pode ser adicionado. … Cada nó do trabalhador só pode acessar e adicionar ao seu próprio valor de acumulador local e somente o programa de driver pode acessar o valor global.

Como funciona o acumulador Spark?

Acumuladores são variáveis que são usadas para agregar informações entre os executores. Por exemplo, essas informações podem pertencer a dados ou diagnóstico de API, como quantos registros estão corrompidos ou quantas vezes uma API de biblioteca específica foi chamada.

Por que a variável acumuladora no Spark não deve ser usada pelo trabalhador para operações de transformação?

Acumulador dará saída errada. Se uma tarefa estiver lenta, o Spark poderá iniciar uma cópia especulativa dessa tarefa em outro nó. Veredicto: Não tratado. O acumulador dará saída errada.

Recomendado: