모델은 부품, 데이터가 본체

2026-04-11 배움

핵심

품아이를 키우면서 “어떤 모델 쓸까”를 반복 고민했다. 근본 원인: 자산과 삽질을 구분하지 못했다.

구분법

자산 (모델 바꿔도 남는 것)삽질 (모델 바꾸면 사라지는 것)
학습 데이터 JSONL특정 모델 최적화 프롬프트 트릭
평가 기준 (정답 셋)모델별 API 호출 코드
도메인 지식 (Q&A, 고객 패턴)모델별 파라미터 튜닝
행동 규칙 (자연어)

결론

  • 파인튜닝 데이터를 모으는 것 자체는 삽질이 아니다 (모델 갈아끼워도 재활용)
  • 모델 선택 고민에 시간 쓰지 말고, 좋은 데이터와 평가 기준 축적에 집중
  • 모델은 갈아끼우는 부품, 데이터와 기준이 품아이의 본체

연결