Princípios de processamento e de volumes de dados massivos. Conceitos básicos de sistemas distribuídos. Modelo de Computação MapReduce: definição e motivação. Ambientes de processamento: Hadoop, Spark. Frameworks sobre Hadoop: Spark, Hive e Impala. Aplicações com ML Lib.