[dbt] 2. Seeds, Sources, Tests, Documentation, Expectations
·
데이터/dbt
dbt Seeds외부 데이터 파일(CSV, Excel 등)을 DBT 프로젝트 내에서 테이블로 변환하는 기능외부 데이터를 데이터베이스 or 데이터 웨어하우스로 로드할 때 사용dbt Sources외부 시스템에 있는 원본 데이터를 정의하는 기능Source 테이블을 참조하는 테이블 모두 바꿔야하는 번거로운 작업 감소스키마, 테이블에 alias를 부여하여 Source 테이블이 바뀌더라도 이후 작업에 영향 XSource 테이블에 새 레코드가 있는지 체크해주는 기능 제공예시더보기1. models/sources.yml 파일 생성version: 2sources: - name: SchemaAlias -- 스키마 별칭 schema: raw_data tables: - name: event -- 테이블 ..
[dbt] 1. dbt?
·
데이터/dbt
dbt데이터 분석 워크플로우에서 데이터 변환 작업을 관리하고 자동화하는 도구 (data build tool)주로 ELT 파이프라인의 Transform 단계에서 사용주요 특징SQL 기반 데이터 변환SQL을 사용하여 데이터 변환손쉽게 모델링과 변환 작업 수행 가능모델 정의 및 계층 구조 관리데이터 변환 작업을 "모델"이라는 단위로 정의모델은 의존성 그래프로 구성되어, 단계별 데이터 처리 가능자동화 및 재현성모델 실행, 데이터 품질 검사, 문서 생성 등의 작업 자동화 가능동일한 데이터를 재현 가능하게 만들어 분석 일관성 보장다양한 데이터 웨어하우스 지원Redshift, BigQuery, Snowflake, Spark, Postgres 등클라우드 버전 존재dbt cloud주요 구성 요소dbt_project.ym..