В этом режиме нет процесса-демона, пользовательская программа и программа Hadoop выполняются в одном и том же Java-процессе, а используемая файловая система является локальной файловой системой, а не распределенной файловой системой.Этот режим обычно используется для локальной отладки.
Псевдораспределенный (псевдокластерный режим)
существуетавтономныйРежим кластера моделируется выше, каждый демон работает в отдельном процессе Java, а используемая файловая система — HDFS.
Полностью распределенный (кластерный режим)
Демон работает в кластере, а также используется файловая система HDFS.
процесс настройки
Эта конфигурация основана на Hadoop2.9.2, в которой Standalone настроен на CentOS 7.2, псевдораспределенный режим настроен на MacOS 10.14.4, полностью распределенный режим настроен на облачном хосте Tencent, а кластер состоит из двух облачных хостов. под управлением систем Ubuntu 14.04.1 и CentOS 7.2 соответственно.
Подготовка окружающей среды
Java 7/8
Hadoop от 2.7.x до 2.x поддерживает Java 7/8, другие версии Hadoop поддерживают версию Java, нажмите здесь?сделать запрос
cd ~
vi .bash_profile
export JAVA_HOME=/usr/lib/jvm/jre-1.8.0-openjdk.i386
source .bash_profile
ssh и rsync: используйтеsshиrsyncПосле командной проверки я обнаружил, что она есть у самого Centos, поэтому устанавливать ее не нужно.
Hadoop
sudo wget http://mirror.bit.edu.cn/apache/hadoop/common/hadoop-2.9.2/hadoop-2.9.2.tar.gz
tar -zxvf hadoop-2.9.2.tar.gz
Адрес загрузки здесь лучше всего выбирать в соответствии с регионом, в котором находится облачный хост.Если это домашний облачный хост, лучше использовать адрес домашнего зеркала, так загрузка будет намного быстрее.
Автономный режим
После загрузки и распаковки Hadoop по умолчанию находится в автономном режиме, и вы можете запустить wordcount непосредственно для тестирования.
После успешного запуска можно пройтиhttp://localhost:8088/Доступ к узлу ResourceManager и ввод jps показывают следующие процессы.
Где ResourceManager и NodeManager — это процессы, принадлежащие YARN.
повторение7операция, введите jps, чтобы запросить процесс
Вы можете видеть, что процесс YarnChild и процесс MRAppMaster добавлены недавно.Причина, по которой существует два процесса YarnChild, заключается в том, что во входной папке есть два текстовых файла, которые показывают, что MapReduce создается путем созданиянесколько процессов параллельновычислительный.
Полностью распределенный режим
Кластер включает в себя два узла. Имена узлов — главный и подчиненный. Процесс настройки узла главного и подчиненного в основном одинаков. Ниже приведен процесс настройки (будет отмечена разница в конфигурации двух узлов. Копируется команда scp подчиненному узлу для модификации.):
После ввода jps на ведущем и ведомом узлах соответственно есть
На этом этапе вы можете получить доступ к веб-интерфейсу HDFS и веб-интерфейсу YARN через http://152.136.76.12:8080 (ip-адрес — общедоступный сетевой IP-адрес мастера) и http://152.136.76.12:50070 соответственно. Вы можете видеть, что есть один подчиненный узел, есть два узла под YARN
запустить подсчет слов (в соответствии с псевдораспределением)
Продолжайте использовать jps для просмотра процессов двух хостов
Вы можете видеть, что процессы в режиме кластера ничем не отличаются от процессов в режиме псевдокластера, разница лишь в том, что процессы выполняются на разных хостах.
Ошибка
Здесь мы в основном фиксируем некоторые ошибки, возникающие в процессе настройки.
Container exited with a non-zero exit code 1. Error file: prelaunch.err.
Эта ошибка возникает, когда wordcount запускается в режиме псевдокластера, настроенном на хосте Tencent Cloud.Я пробовал некоторые методы в Интернете, но ни один из них не может быть разрешен. Наконец, я использовал свою собственную конфигурацию компьютера, чтобы снова успешно запустить его, что может быть связано с проблемой конфигурации облачного хоста.
Запуск на YARN Java.net.ConnectException: в соединении отказано
Возможно, причина в брандмауэре, согласно?Советы в решении
Не удается получить доступ к порту 8088 Hadoop YARN в виртуальной машине из внешней сети
Если вы не можете получить доступ к веб-странице YARN через облачный хост с IP-адресом: 8088, вы можете использоватьnetstat -nlp | grep javaПроверьте порт, который в настоящее время предоставляет веб-службу. Если IP-адрес 127.0.0.1, это доказывает наличие проблемы и необходимость изменения хостов. Конкретный процесс см.?.
slave: bash: line 0: cd: /root/hadoop/hadoop-2.9.2: No such file or directory
При настройке режима кластера основная причина заключается в том, что путь к хранилищу Hadoop не соответствует ведущему при ручной настройке ведомого устройства.Это можно решить, поместив ведомое устройство Hadoop по тому же пути, что и ведущее устройство.