Hadoop для Apache
- Hadoop — распределенная система для обработки больших данных, разработанная Apache Software Foundation.
- Hadoop состоит из нескольких компонентов, включая файловую систему HDFS и движок MapReduce.
- Файловая система HDFS обеспечивает хранение данных и поддержку работы в стойке.
- Механизм MapReduce состоит из JobTracker и TaskTracker, распределяющих работу между узлами кластера.
- Hadoop имеет различные планировщики заданий, включая честный планировщик и планировщик производительности.
- Hadoop может быть использован для различных приложений, включая базу данных HBase, систему машинного обучения Apache Mahout и хранилище данных Apache Hive.
- Hadoop может быть развернут как в локальном центре обработки данных, так и в облаке.
- Коммерческие компании предлагают коммерческую реализацию или поддержку Hadoop.
Полный текст статьи: