-
(pytorch) pytorch lightning 사용 시, 이어서 학습하기IT 지식 창고 2023. 2. 8. 18:34
컴퓨터의 강제종료, RAM 또는 VRAM의 부족 등과 같은 부득이한 상황에서 학습이 중단된 경우 이어서 학습하는 방법이 있습니다.
물론, 이어서 학습하기 위해서는 중단되기전에 .ckpt file을 저장해야합니다. (callbacks.ModelCheckpoint() 함수 활용)
trainer.fit(model, train, val, ckpt_path=checkpoint_path)
pytorch lightning으로 학습할 때 사용하는 fit 함수 안에 ckpt_path에 이어서 학습할 .ckpt file경로를 넣어주면 됩니다.
그러면, 해당 .ckpt를 사용하여 weight를 update하고, 시작 epoch을 이어서 설정합니다. (만약 10epoch에서 중단되었다면, 11epoch부터 다시 시작합니다.)
* keras와 같은 경우는 이어서 학습 시 initial_epoch이라는 변수가 있기 때문에 시작 epoch을 직접 설정한 후 이어서 학습합니다.
'IT 지식 창고' 카테고리의 다른 글
(Pytorch) Pytorch에서 학습 및 테스트 시 GPU VRAM이 계속 증가하는 이유 (2) 2024.02.14 (Docker) docker container 내에서 root계정과 root권한을 가진 사용자 계정 사용하기 (0) 2023.08.03 (pytorch) torch에서 사용할 수 있는 3d classification models 정리 (0) 2023.02.07 (VSCode) vscode에서 python 사용 시, custom module 인식하는 법 (0) 2023.01.18 (Python) Jupyter Notebook 내에서만 환경 변수 설정 방법 (0) 2023.01.10 댓글