Hadoop: почему не получается запустить MapReduce задачу?

Question

facha @facha

Hadoop

Hadoop: почему не получается запустить MapReduce задачу?

Всем привет.

Делаю первые шаги в освоении Hadoop. Настроил "кластер" из пары виртуалок. Не могу запустить MapReduce-задачу.

sudo -uhdfs yarn jar /usr/lib/hadoop-mapreduce/hadoop-mapreduce-examples.jar pi 1 1

В логе ResourceManager-а доходит до такого:

13/12/10 23:30:02 INFO mapreduce.JobSubmitter: Submitting tokens for job: job_1386714123362_0001
13/12/10 23:30:02 INFO client.YarnClientImpl: Submitted application application_1386714123362_0001 to ResourceManager at master/192.168.122.175:8032
13/12/10 23:30:02 INFO mapreduce.Job: The url to track the job: http://master:8088/proxy/application_1386714123362_0001/
13/12/10 23:30:02 INFO mapreduce.Job: Running job: job_1386714123362_0001

... и молчек. Задача остается висеть навечно. В логе NodeManager-ов никаких новых сообщений не наблюдается

#hadoop job -list
...
                  JobId	     State	     StartTime	    UserName	       Queue	  Priority	 UsedContainers	 RsvdContainers	 UsedMem	 RsvdMem	 NeededMem	   AM info
 job_1386790587985_0001	      PREP	 1386801628645	        hdfs	     default	    NORMAL	              0	              0	      0M	      0M	        0M	master:8088/proxy/application_1386790587985_0001/

Вопрос задан более трёх лет назад
11212 просмотров

Комментировать

Подписаться 3 Оценить Комментировать

Решения вопроса 1

2 комментария

Пригласить эксперта

Ответы на вопрос 1

Комментировать

Ваш ответ на вопрос

Войдите, чтобы написать ответ

Похожие вопросы

Hadoop

+1 ещё

Средний
Как подключиться к удалённому hdfs из pyspark?
- 1 подписчик
- 03 янв.
- 22 просмотра
0

ответов
DevOps

+2 ещё

Средний
Возможно ли несколько Hadoop на одной машине?
- 1 подписчик
- 11 дек. 2024
- 86 просмотров
0

ответов
SQL

+1 ещё

Средний
Массив структур в Hive. Как проверить вхождение в массив структуры по маске?
- 1 подписчик
- более года назад
- 229 просмотров
0

ответов
Базы данных

+2 ещё

Средний
Может ли Grafana напрямую слать запросы в табличку на hdfs и рисовать временной ряд?
- 1 подписчик
- более двух лет назад
- 107 просмотров
3

ответа
Oracle

+2 ещё

Средний
Как сравнить две базы данных?
- 6 подписчиков
- более двух лет назад
- 1816 просмотров
1

ответ
Hadoop

+1 ещё

Средний
Как подключиться через airflow к hdfs, развернутой в docker?
- 1 подписчик
- более двух лет назад
- 104 просмотра
0

ответов
Python

+2 ещё

Простой
Как запуститьpyspark functions lag?
- 1 подписчик
- более трёх лет назад
- 52 просмотра
1

ответ
Big data

+3 ещё

Средний
Ресурсы для Apache Spark?
- 2 подписчика
- более трёх лет назад
- 136 просмотров
0

ответов
PHP

+1 ещё

Простой
Как соединиться с Apache Hive в PHP-коде?
- 1 подписчик
- более трёх лет назад
- 104 просмотра
0

ответов
Docker

+1 ещё

Простой
Как включить и настроить WebHDFS в Docker-контейнере Apache Hadoop?
- 1 подписчик
- более трёх лет назад
- 166 просмотров
0

ответов
Показать ещё Загружается…

Data Scientist

Selecty

от 180 000 до 240 000 ₽

Senior DE/Team Lead

Сбер • Санкт-Петербург

До 420 000 ₽

Аналитик Python

Selecty • Москва

До 170 000 ₽

Answer 1 · 2013-12-15 23:25:13

Привожу рабочие конфиги для кластера hadoop 2.2.0 с узлами master и slave:
etc/hadoop/core-site.xml

<configuration>
	<property>
		<name>fs.defaultFS</name>
		<value>hdfs://master:9000</value>
	</property>
</configuration>

etc/hadoop/hdfs-site.xml

<configuration>
	<property>
		<name>dfs.replication</name>
		<value>2</value>
	</property>
	<property>
		<name>dfs.namenode.name.dir</name>
		<value>file:/usr/local/hadoop/tmp/hdfs/namenode</value>
	</property>
	<property>
		<name>dfs.datanode.data.dir</name>
		<value>file:/usr/local/hadoop/tmp/hdfs/datanode</value>
	</property>
</configuration>

etc/hadoop/mapred-site.xml

<configuration>
	<property>
		<name>mapreduce.framework.name</name>
		<value>yarn</value>
	</property>
</configuration>

etc/hadoop/yarn-site.xml

<configuration>
	<property>
		<name>yarn.nodemanager.aux-services</name>
		<value>mapreduce_shuffle</value>
	</property>
	<property>
		<name>yarn.nodemanager.aux-services.mapreduce.shuffle.class</name>
		<value>org.apache.hadoop.mapred.ShuffleHandler</value>
	</property>
	<property>
		<name>yarn.resourcemanager.scheduler.address</name>
		<value>master:8030</value>
	</property>
	<property>
		<name>yarn.resourcemanager.address</name>
		<value>master:8032</value>
	</property>
	<property>
		<name>yarn.resourcemanager.webapp.address</name>
		<value>master:8088</value>
	</property>
	<property>
		<name>yarn.resourcemanager.resource-tracker.address</name>
		<value>master:8031</value>
	</property>
	<property>
		<name>yarn.resourcemanager.admin.address</name>
		<value>master:8033</value>
	</property>
</configuration>

Также убедитесь, что у вас все в порядке с файлом /etc/hosts

Answer 2 · 2013-12-15 14:46:17

Столкнулся с такой же проблемой. Вы сразу создавали кластер из несколькоих виртуалок? Пробовали запускать в псевдораспределенном режиме с одним узлом? У меня так работает.
Сейчас я немного перенастраиваю кластер и вечером подробнее напишу вам, смог ли я побороть эту проблему. Ну и напишу решение.

Hadoop: почему не получается запустить MapReduce задачу?

Войдите, чтобы написать ответ

Минуточку внимания

Войдите на сайт