TAD Features
Updated 2024.07.06
기능 개요
TAD의 pipeline
AI Contents의 pipeline은 기능 단위인 asset의 조합으로 이루어져 있습니다. Train pipeline
과 Inference pipeline
은 총 5가지 asset의 조합으로 구성되어 있습니다.
Train pipeline
Input - Readiness - Preprocess - Train
Inference pipeline
Input - Readiness - Preprocess - Inference
각 단계는 asset으로 구분됩니다.
Train Pipeline
1. Input Asset
사용자가 experimental_plan.yaml
에 지정한 경로 내 모든 파일을 읽어와 하나의 dataframe으로 만들어 줍니다. 데이터 경로는 load_train_data_path
에 지정되며, 폴더 내 모든 파일을 읽어와 병합합니다.
2. Readiness Asset
데이터가 TAD 모델링에 적합한지 검사합니다. 여기서 데이터의 컬럼 유형을 분류하고, 필요한 최소 데이터 수를 확인합니다. 데이터의 모든 컬럼이 numeric 또는 categorical로 적절히 분류되어 있는지, 결측치 비율이 높지 않은지 등을 점검합니다.