Lesson 1: Building a Big Data Infrastructure Part 1

Unstructured Storage & Hadoop

HBase - A column oriented database modeled after Google's BigTable
ZooKeeper - A service for maintaining configuration and distributed synchronization
Hive - Provides a SQL like interface for querying data in Hadoop
Cascading - A framework for creating data processing workflows in Hadoop
Pig - A high level language for creating MapReduce programs
Flume - Useful for moving log data into Hadoop