Browsing All Posts filed under »Hadoop«

A Nova Era do OLAP – Modernizando o seu EDW [Enterprise Data Warehouse] com Data Lake

março 8, 2018

0

Introdução A industria 4.0 é uma realidade e com issos dados passam a não ser somente pedaços de bytes mas sim a parte crucial do seu negócio, a informação traz a vantagem competitiva e diferenciação do seu produto em seu seguimento de atuação no mercado atual. A realidade é que, mais de 85% dos dados […]

Big Data Series – Processando Dados com Pig no HDInsight

novembro 7, 2017

1

  Introdução   A explosão dos dados semi e não-estruturados graças ao surgimento do que conhecemos como IoT, impacta todas as empresas que necessitam dos dados para tomar decisões, realizar análises, atrair clientes, mitigar riscos, diminuir despesas assim como atender a demandas de negócio em sua área. A realidade é, a maioria dos dados atualmente […]

Azure HDInsight Tools para Visual Studio Code

outubro 18, 2017

0

Nesse blog post irei mostrar como podemos utilizar o Visual Studio Code para visualizar seu cluster de Hadoop no Microsoft Azure [HDInsight] assim como execução de PySpark e Jobs em Batch Mode do Hive. Apache Hadoop Hadoop é a plataforma de software de computação distribuída em máquinas [clusters] para processamento de TB a PB de […]