1. 하둡 설치 타입
- 독립형(Standalone)
- 로컬 파일 시스템에 데이터를 저장
- 단일 맵퍼와 단일 리듀서를 이용
- 자신의 코드를 실행하는 개발자에게 적합
- 가상 분산형
- 실제 멀티노드(분산) 클러스터처럼 모든 서비스를 설정할 수 있음
- 모든 데몬(데이터 노드, 네임 노드, 리소스 매니저 프로세스)는 단일 노드에서 동작
- 실제 운영 환경에서 사용 x
- 완전 분산형
- 여러 서버에 걸쳐 하둡을 설치
- 데이터 복제, 고가용성 설정 가능
- 다중 서버를 통해 각 프로세스들을 위한 데몬 운영
2. 운영 시스템의 유용한 유틸리티
- yum
- Red Hat Enterprise Linux RPM SW 패키지를 가져와 설정, 삭제, 검색, 관리할 수 있게 해주는 툴
- 우문투 리눅스에서는 apt-get
- rpm
- Red Hat, SUSE, Fedora 리눅스 시스템의 패키지를 관리, 빌드, 설치, 검색, 확인, 업데이트 및 제거
- 패키지: 이름, 버전과 같은 파일과 패키지 정보 소유
- scp
- FTP 절이나 원거리 시스템에 접속하지 않고도 호스트들 사이에서 안전하게 파일과 디렉토리들을 복사할 수 있는 명령어
- SSH 사용하기 때문에 인증 패스워드 필요
- curl
- URL을 이용해 파일을 보내거나 받을 수 있는 유틸리티
- wget
- HTTP나 FTP 프로토콜을 사용해 파일을 가져오는 네트워크 유틸리티
- pdsh
- 병렬화된 원격 쉘
- 명령을 원격으로 실행
3. 하둡 클러스터 환경
- 리눅스 커널 매개변수 값을 조정해 클러스터의 성능을 높일 수 있
'⭐ Plogramming > BigData' 카테고리의 다른 글
분산 클러스터를 위한 하둡 시스템 (0) | 2023.07.16 |
---|---|
Apache Flink란? (0) | 2023.07.14 |
TimeWindow란 (1) | 2023.07.13 |
Chapter 2. 하둡 아키텍쳐 (0) | 2023.07.02 |
Chapter 1. 하둡 소개 및 환경 (0) | 2023.07.02 |