[데이터, AWS] 15. Redshift?

2024. 10. 29. 22:42·AWS

Redshift?

  • AWS에서 제공하는 완전 관리형 클라우드 기반 데이터 웨어하우스 서비스!
  • 대규모 데이터 세트를 빠르게 분석하고 복잡한 쿼리를 처리할 수 있도록 설계
  • 관계형 데이터베이스와 유사한 SQL 쿼리를 지원

Redshift의 특징

  • 2PB의 데이터까지 처리 가능(최소 160GB)
  • Still OLAP : 응답속도가 빠르지 않아, 프로덕션 데이터베이스로 사용 불가
  • 컬럼 기반 스토리지
    • 레코드 별로 저장하는 것이 아닌, 컬럼 별 저장
    • 컬럼별 압축이 가능하며, 컬럼의 추가, 삭제 작업이 매우 빠름!
  • 벌크 업데이트 지원 : 레코드가 들어있는 파일을 S3로 복사 후 COPY 커맨드로 Redshift로의 일괄 복사 가능!
  • 데이터 공유(Datashare) : 다른 AWS 계정과 특정 데이터 공유 가능!
  • Primary Key Uniqueness 보장 X : OLAP용으로 설계된 데이터 웨어하우스이기에, 유일성 검사와 무결성 제약의 강제 X
  • MPP(Massively Parallel Processing) 구조
    • MPP 아키텍처를 기반으로 작동하여, 쿼리를 여러 노드에 분산하여 병렬 실행 가능!
    • 여러 컴퓨팅 노드를 구성할 수 있는 클러스터 형태로 운영되며, 각 노드는 자체 CPU, 메모리, 스토리지를 갖고 독립적인 작업 수행 가능

Redshift의 아키텍처

  • 리더 노드
    • 사용자가 실행하는 SQL 쿼리를 받아 쿼리 계획을 생성하고, 이를 컴퓨팅 노드에 분배하여 실행하도록 명령!
    • 최종 쿼리 결과를 수집하여 사용자에게 반환!
  • 컴퓨팅 노드
    • 리더 노드로부터 전달받은 쿼리의 일부를 실행하며, 병렬 처리를 통해 높은 성능 제공!
    • 각 컴퓨팅 노드는 데이터를 독립적으로 저장하고, 이를 처리하여 리더 노드에 결과 반환!
  • 스토리지
    • 각 컴퓨팅 노드에 로컬로 결합!
    • 컬별 기반 스토리지이므로 디스크 I/O를 줄이고 데이터 압축률을 높여 쿼리 성능 개선!
저작자표시

'AWS' 카테고리의 다른 글

[AWS] 14. Lambda  (0) 2024.10.28
[AWS] 13. AWS에서의 CI/CD?  (0) 2024.10.25
[AWS] 12. S3?  (0) 2024.10.25
[AWS] 11. IAM?  (0) 2024.10.25
[AWS] 10. VPC?  (0) 2024.10.25
'AWS' 카테고리의 다른 글
  • [AWS] 14. Lambda
  • [AWS] 13. AWS에서의 CI/CD?
  • [AWS] 12. S3?
  • [AWS] 11. IAM?
김줘
김줘
김줘와 같이 데이터, 컴퓨터, IT 공부
  • 김줘
    초보개발자 김줘의 코딩일기
    김줘
  • 전체
    오늘
    어제
    • 분류 전체보기
      • 데이터 엔지니어링 데브코스
      • 데이터
        • Airflow
        • Spark
        • Kafka
        • dbt
      • TroubleShooting
      • Docker
      • AWS
      • 크롤링, 스크래핑, 시각화
        • Selenium
        • 시각화
      • 코딩테스트
        • 프로그래머스
        • 입출력과 사칙연산
        • 정렬
      • Django
      • 자바 공부
      • 끄적끄적
  • 블로그 메뉴

    • 홈
    • 태그
    • 방명록
  • 링크

  • 공지사항

  • 인기 글

  • 태그

    에어플로우
    초보개발자
    부트캠프
    Java
    Airflow
    Python
    데이터 엔지니어링 데브코스 4기
    프로그래밍
    aws
    데이터 엔지니어
    데이터 엔지니어링 데브코스
    cloud
    프로그래머스
    파이썬
    TiL
    데브코스
    자바
    오블완
    Azure
    티스토리챌린지
  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.0
김줘
[데이터, AWS] 15. Redshift?
상단으로

티스토리툴바