[Coursera/IBM course #7] Data preparation for LLMs
·
🥇 certification logbook
[IBM course #7] Generative AI and LLMs: Architecture and Data Preparation Data LoaderDataLoader는 대규모 텍스트나 이미지 등 다양한 데이터셋을 효율적으로 불러오고(batch), 섞고(shuffle), 전처리하는 데 사용되는 PyTorch의 핵심 도구PyTorch에서는 torch.utils.data.DataLoader 클래스를 사용함. Dataset: 전체 데이터를 담고 있으며, 학습(train), 검증(val), 테스트(test) 세트로 나누어 사용함CustomDataset 클래스: 사용자 정의 데이터셋 클래스 (반드시 __init__, __len__, __getitem__ 메서드 필요)init() : 데이터 불러오기len() :..