하둡 설치 후 AWS 서버에서 Jps를 통해 하둡 Job이 정상 시작한 것은 확인 할 수 있었다.
하지만 로컬(Windows)에서 Chrome과 같은 브라우저를 통해
Web 화면을 띄워 정상 시작을 확인하는 과정에서 많은 시간이 소요되었다.
[문제점]
1. 방화벽 문제
2. Hadoop Default 문제
0. Hadoop job 확인
위의 해결방법을 찾아보기 전, 가장 먼저 확인해야 할 것은 Hadoop이 서버에 떠있지 않아 화면을 볼 수 없는 경우가 있으므로,
jps를 통해 job이 정상 실행되고 있는지 먼저 확인한다.
1. 방화벽 문제
Windows Chrome에서 하둡 인터페이스 웹에 접근하려 했더니 계속해서 방화벽 문제가 발생했다.
검색을 하다가 centos에 방화벽을 설치하고 세팅해주었는데, AWS에선 방화벽을 그렇게 관리하지 않는다고 한다.
-> firewall 등 방화벽 설정을 모두 off 하고 삭제한다.
1) Instance의 Inbound 규칙을 확인해보자.
EC2 > 네트워크 및 보안 > 보안 그룹을 클릭하면 아래와 같은 화면이 뜬다.
( 인스턴스를 생성했던 메뉴 아래에 있다)
인바운드 규칙을 편집하자.
우선, 모든 TCP 유형을 사용하여 0~65535 포트 모두 접속할 수 있도록 세팅해두었다.
나중에 필요한 포트만 9000-9999, 8080 등 사용자 지정 TCP 유형을 통해 설정해주면 된다.
2. Hadoop Default 문제
위의 방법으로도 해결되지 않는다면, 접속하려고 했던 port가 현재 실행중인 hadoop의 default 버전이 맞는지 확인한다.
다른 포스팅들과 세팅이 모두 동일했는데, 하둡을 다시 깔아도 화면이 띄워지지 않았다.
알고보니 하둡이 3.x대로 버전업되며 사용하는 default port가 변경되었음을 알게되었다.
아래와 같이 변경되었다.
따라서 기존에 쓰던 50070 포트로는 접속이 되지 않고 9870 포트를 이용하니 정상 접속이 되었다.