[Hadoop] 1. YARN?

2024. 11. 28. 20:29·데이터

YARN?

  • Yet Another Resource Negotiator -> 또 다른 작업 협상자!
  • Hadoop 2.0부터 도입된 Resource Management Layer. 즉, Hadoop 에코시스템의 자원 관리 프레임워크로, 클러스터의 컴퓨팅 자원을 효율적으로 관리하고 작업을 스케줄링
  • HDFS 위에서 동작하며, 데이터 저장과 처리가 분리된 구조 지원

Architecture

출처 : InterviewBit

  • ResourceManager : 클러스터 전체의 자원을 관리하고 작업 실행을 조율
  • NodeManager : 각 노드에서 자원 사용 상태를 관리하고 작업 컨테이너 실행
  • ApplicationMaster : 특정 애플리케이션의 실행 계획을 관리하고 자원 요청
  • Container : 작업 실행에 필요한 자원을 묶어 제공하는 최소 단위의 실행 환경

YARN의 동작

  1. Client에서 실행 코드와 환경 정보를 Resource Manager(RM)에 제출
  2. Resource Manager에서 Application Manager를 시작하기 위한 컨테이너 할당
  3. Application Manager에서 Resource Manager에 등록
  4. Application Manager에서 Resource Manager로부터 컨테이너를 요청
  5. Application Manager에서 Node Manager에 컨테이너 실행 요청
  6. 컨테이너에서 애플리케이션 코드 실행
  7. Client에서 Resource Manager 또는 Application Manager로 상태 확인
  8. 처리 완료 후 Application Manager에서 Resource Manager와의 등록 해제
저작자표시 (새창열림)

'데이터' 카테고리의 다른 글

[데이터] Primary Key Uniqueness?  (1) 2024.11.11
[데이터] Superset?  (0) 2024.10.31
[데이터] Snowflake?  (1) 2024.10.31
[데이터] 데이터 레이크?  (0) 2024.10.29
[데이터] 데이터 웨어하우스?  (0) 2024.10.29
'데이터' 카테고리의 다른 글
  • [데이터] Primary Key Uniqueness?
  • [데이터] Superset?
  • [데이터] Snowflake?
  • [데이터] 데이터 레이크?
김줘
김줘
김줘와 같이 데이터, 컴퓨터, IT 공부
  • 김줘
    초보개발자 김줘의 코딩일기
    김줘
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 데이터 엔지니어링 데브코스
      • 데이터
        • Airflow
        • Spark
        • Kafka
        • dbt
      • TroubleShooting
      • Docker
      • AWS
      • 크롤링, 스크래핑, 시각화
        • Selenium
        • 시각화
      • 코딩테스트
        • 프로그래머스
        • 입출력과 사칙연산
        • 정렬
      • Django
      • 자바 공부
      • 끄적끄적
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    자바
    Azure
    데브코스
    Python
    초보개발자
    에어플로우
    TiL
    aws
    데이터 엔지니어
    cloud
    데이터 엔지니어링 데브코스 4기
    Airflow
    파이썬
    부트캠프
    티스토리챌린지
    데이터 엔지니어링 데브코스
    프로그래머스
    프로그래밍
    Java
    오블완
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
김줘
[Hadoop] 1. YARN?
상단으로

티스토리툴바