VAD Input and Artifacts
Updated 2025.05.12
데이터 준비
학습 데이터 준비
- png, .jpg 형태의 동일한 shape(1024x1024, 3채널와 같은 형태)을 가진 정상(혹은 동일한 유형) 이미지 데이터를 준비합니다.
- 이미지 경로와 정답 label(모두 정상이기 때문에 동일 유형으로 작성)로 이루어진 tabular 형태의 Ground truth 파일을 준비합니다.
- 일부 비정상(혹은 소수의 다른 유형) 이미지 데이터가 있는 경우 학습 데이터에 포함시키면 더욱 더 정확한 AI 모델이 생성됩니다.
- Ground truth 파일은 하기와 같은 형태로 준비하시면 됩니다.
- Ground truth 파일을 준비할 때 여러 유형을 가진 이상 이미지에 대해 라벨을 통일할 필요는 없습니다.
- 만약 검증을 원하는 데이터가 있다면
train_validation_column
argument에 항목명을 입력하면 train에 해당하는 이미지는 학습에 사용되며 기타 이미지는 검증에 사용되어 성능을 확인할 수 있습니다. (만약 정상 이미지만 있어도 성능만 도출이 되지 않을 뿐 정상적으로 학습됩니다.) - Ground truth 파일과 이미지 파일을 같은 폴더에 넣어서 준비합니다.
- 추론 데이터의 경우 학습 데이터와 마찬가지로 Ground truth 파일을 준비하거나, 추론을 원하는 이미지를 하나의 폴더 내 준비합니다. (추론 데이터의 경우 Ground truth 파일이 없는 경우 이미지가 저장된 경로를 보고 내부적으로 파일을 생성합니다.)
- 학습 데이터 유형은 여러 유형으로 구성되도 정상 유형과 abnormal 유형으로 두 가지로만 분류를 수행합니다.
학습 데이터셋 예시
label | image_path | train_val_split |
---|---|---|
good | ./image0.png | train |
bad | ./image1.png | valid |
good | ./image2.png | train |
good | ./good/image0.png | train |
good | ./good/image1.png | train |
good | ./good/image0.jpg | train |
good | ./good/image1.jpg | train |
input data directory 구조 예시
/project_folder/sample_data
└ inference
└ 10479_0.png
└ 1080_7.png
└ 10735_7.png
└ train
└ train.csv
└ abnormal
└ 10019_0.png
└ 10024_0.png
└ 10097_0.png
└ good
└ 10395_7.png
└ 10034_7.png
└ 10852_7.png