본문으로 건너뛰기
버전: docs v25.02

Request model training

Updated 2024.09.25

Request for training

Streams → Actions → Train Model

모델 학습 요청은 Stream을 통해 Dataset과 Train Pipeline 실행 정보를 AI Conductor에 전달하고, AI Model을 반환 받는 작업입니다. 모델 학습 요청 시 Edge Conductor에서 AI Conductor로 전달되는 정보는 아래와 같습니다.

  • 학습 Dataset: 모델 학습 요청 시 선택한 Dataset으로, AI Model이 학습할 데이터입니다. 사용자는 하나이상의 데이터셋을 선택할 수 있습니다.
  • AI Solution: Stream 생성 시 선택한 Solution은 모델 학습 환경 설정에 대한 정보를 포함하고 있습니다. AI Conductor에서는 Solution 정보를 참조하여 Train Pipeline을 실행시킵니다.
  • Train Pipeline: 현재 활용 중인 AI Solution의 Train Pipeline입니다.
  • Parameters: 사용자가 Stream 생성 시 Train Pipeline에 입력한 사용자 파라미터 정보입니다.

AI Conductor에서는 Train Pipeline을 실행시키고, 학습된 AI Model을 Edge Conductor에 반환하며, Stream의 Model History에 학습 이력이 남습니다.

To request model training

  1. Navigate to the Edge Conductor and login.
  2. In the left navigation pane, choose Stream.
  3. Choose the stream to train model. The stream status should be ready to train.
  4. Press the train button(brain icon) in the stream status pane or click Actions in the upper right corner and select train model.
  5. Choose the dataset to train model. (or User can train model using the sample dataset provided by the solution by performing check - Start with Sample Dataset )
  6. In the Train Resource section, select the system resources to be used for training.
  7. Press Train button.


Stop training

사용자는 학습 중인 모델을 학습 취소할 수 있습니다.

Streams 메뉴의 Stream List 테이블에서 Status 컬럼에서 학습 여부를 확인할 수 있으며, 학습 중인 Stream은 멈춤 버튼이 활성화 됩니다. 사용자는 멈춤 버튼을 눌러 수행 중인 학습을 멈출 수 있습니다. 정상적으로 멈춰진 학습이력은 Inf. Model History 화면에서 Model Status에서 확인가능합니다.



Status of model train

Stream 테이블의 Status 및 Inf. Model History화면의 Model Status를 통해서 사용자는 모델의 학습 상태를 확인할 수 있습니다.

  • Training : 학습데이터를 S3올리는 과정을 포함하여, AI Conductor에서 학습 중인 상태입니다.
  • Training Failure : 학습이 실패한 경우 입니다. 사용자는 Inf. Model History의 모델 항목에서 Train Artifacts의 Log View 기능을 통해 학습 로그를 확인할 수 있습니다.
  • Ready to Deploy : 학습이 성공하였으며, Edge로 solution 및 모델을 배포할 준비가 된 상태입니다.
  • Train Stopped : 학습 중 사용자가 학습을 멈춘 상태입니다.