Hadoop для Apache

  • Hadoop — распределенная система для обработки больших данных, разработанная Apache Software Foundation. 
  • Hadoop состоит из нескольких компонентов, включая файловую систему HDFS и движок MapReduce. 
  • Файловая система HDFS обеспечивает хранение данных и поддержку работы в стойке. 
  • Механизм MapReduce состоит из JobTracker и TaskTracker, распределяющих работу между узлами кластера. 
  • Hadoop имеет различные планировщики заданий, включая честный планировщик и планировщик производительности. 
  • Hadoop может быть использован для различных приложений, включая базу данных HBase, систему машинного обучения Apache Mahout и хранилище данных Apache Hive. 
  • Hadoop может быть развернут как в локальном центре обработки данных, так и в облаке. 
  • Коммерческие компании предлагают коммерческую реализацию или поддержку Hadoop. 

Полный текст статьи:

Apache Hadoop — Википедия, бесплатная энциклопедия

Оставьте комментарий

Прокрутить вверх