Request model training
Updated 2024.09.25
Request for training
Streams → Actions → Train Model
모델 학습 요청은 Stream을 통해 Dataset과 Train Pipeline 실행 정보를 AI Conductor에 전달하고, AI Model을 반환 받는 작업입니다. 모델 학습 요청 시 Edge Conductor에서 AI Conductor로 전달되는 정보는 아래와 같습니다.
- 학습 Dataset: 모델 학습 요청 시 선택한 Dataset으로, AI Model이 학습할 데이터입니다. 사용자는 하나이상의 데이터셋을 선택할 수 있습 니다.
- AI Solution: Stream 생성 시 선택한 Solution은 모델 학습 환경 설정에 대한 정보를 포함하고 있습니다. AI Conductor에서는 Solution 정보를 참조하여 Train Pipeline을 실행시킵니다.
- Train Pipeline: 현재 활용 중인 AI Solution의 Train Pipeline입니다.
- Parameters: 사용자가 Stream 생성 시 Train Pipeline에 입력한 사용자 파라미터 정보입니다.
AI Conductor에서는 Train Pipeline을 실행시키고, 학습된 AI Model을 Edge Conductor에 반환하며, Stream의 Model History에 학습 이력이 남습니다.
To request model training
- Navigate to the Edge Conductor and login.
- In the left navigation pane, choose Stream.
- Choose the stream to train model. The stream status should be ready to train.
- Press the train button(brain icon) in the stream status pane or click Actions in the upper right corner and select train model.
- Choose the dataset to train model. (or User can train model using the sample dataset provided by the solution by performing check - Start with Sample Dataset )
- In the Train Resource section, select the system resources to be used for training.
- Press Train button.
Stop training
사용자는 학습 중인 모델을 학습 취소할 수 있습니다.
Streams 메뉴의 Stream List 테이블에서 Status 컬럼에서 학습 여부를 확인할 수 있으며, 학습 중인 Stream은 멈춤 버튼이 활성화 됩니다. 사용자는 멈춤 버튼을 눌러 수행 중인 학습을 멈출 수 있습니다. 정상적으로 멈춰진 학습이력은 Inf. Model History 화면에서 Model Status에서 확인가능합니다.
Status of model train
Stream 테이블의 Status 및 Inf. Model History화면의 Model Status를 통해서 사용자는 모델의 학습 상태를 확인할 수 있습니다.
- Training : 학습데이터를 S3올리는 과정을 포함하여, AI Conductor에서 학습 중인 상태입니다.
- Training Failure : 학습이 실패한 경우 입니다. 사용자는 Inf. Model History의 모델 항목에서 Train Artifacts의 Log View 기능을 통해 학습 로그를 확인할 수 있습니다.
- Ready to Deploy : 학습이 성공하였으며, Edge로 solution 및 모델을 배포할 준비가 된 상태입니다.
- Train Stopped : 학습 중 사용자가 학습을 멈춘 상태입니다.