본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.
야놀자 리뷰 요약 프로젝트는 AI 서비스의 전체 개발 과정을 배워 볼 수 있다
1. 프로젝트의 강점
- 단순하면서도 실용적인 태스크
리뷰 요약은 상대적으로 쉬운 NLP 태스크에 속하지만, 실제 서비스로 연결하려면 여러 가지 조건과 제약을 설정해야 한다. 특히, 주어진 텍스트만 활용하기 때문에 외부 지식이 필요 없다는 점에서 AI 모델을 실험하고 적용하기에 적합한 프로젝트였다.
- End-to-End 개발 경험
이 프로젝트는 단순히 AI 모델을 돌려보는 것이 아니라, 데이터 수집부터 모델 튜닝, 그리고 GUI 기반의 데모 제작까지 포함되었다. 따라서 단순히 AI 모델을 활용하는 것뿐만 아니라, 이를 서비스로 구현하는 과정까지 배울 수 있었다.
- 실전에서 고려해야 할 요소 학습
단순히 모델의 성능만 고려하는 것이 아니라, 비용 문제, 가드레일(안전장치) 설정, 입력 데이터의 품질 관리 등 현실적인 이슈들을 함께 다루었다. 특히, GPT 모델의 Context Window(최대 입력 토큰 수)와 비용을 고려하여 적절한 후기 개수를 설정하는 과정이 인상적이었다.
2. 개선할 점 및 배운 점
🔹 데이터 필터링 및 전처리의 중요성
처음에는 단순히 모든 리뷰를 요약하면 될 것이라 생각했지만, 모텔과 호텔, 펜션 등 숙소 유형에 따라 후기 데이터의 기간을 다르게 설정해야 한다는 점이 흥미로웠다. 또한, 리뷰 수가 너무 적거나 글자 수가 부족할 경우 요약하지 않는 등의 전처리 과정이 필수적이라는 점을 배울 수 있었다.
🔹 Prompt Engineering의 중요성
GPT 모델을 활용하는 과정에서 프롬프트 설계(Prompt Development Cycle)의 중요성을 다시금 깨달았다. 같은 데이터를 넣더라도 어떻게 질문하느냐에 따라 결과의 품질이 크게 달라졌다. 따라서 단순한 프롬프트가 아니라, 모델이 더 나은 요약을 생성할 수 있도록 다양한 시도를 해보는 과정이 필요했다.
🔹 비용 최적화 전략 필요
GPT-3.5-turbo 모델을 활용하면서 비용 문제도 고려해야 했다. 모델이 감당할 수 있는 입력 토큰 수를 넘지 않도록 후기 개수를 제한하는 방식이 필요했고, 이는 실제 서비스로 운영될 때 더욱 중요한 요소가 될 것이다.
3. 결론 및 느낀 점
이 프로젝트는 단순히 AI 모델을 활용하는 것이 아니라, 이를 실제 서비스로 연결하는 과정에서 어떤 점들을 고려해야 하는지 깊이 있게 배울 수 있는 기회였다. 특히, 데이터 필터링, 비용 최적화, 프롬프트 엔지니어링 등 AI 모델을 실제 환경에서 활용하기 위해 필요한 요소들을 직접 경험할 수 있었다.
① 오늘자 날짜, 공부 시작 시각
② 오늘자 날짜, 공부 종료 시각
③ 클립 1번 수강 인증 사진
④ 클립 2번 수강 인증 사진
⑤ 학습 인증샷 1장 이상 (ex. 필기 촬영, 작업물, 등)
리뷰 데이터 크롤링
'패스트캠퍼스 환급 챌린지' 카테고리의 다른 글
패스트캠퍼스 환급챌린지 6일차 미션(2월6일):프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 강의후기 (0) | 2025.02.06 |
---|---|
패스트캠퍼스 환급챌린지 5일차 미션(2월5일):프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 강의후기 (0) | 2025.02.05 |
패스트캠퍼스 환급챌린지 3일차 미션(2월3일):프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 강의후기 (0) | 2025.02.03 |
패스트캠퍼스 환급챌린지 2일차 미션(2월2일):프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 강의후기 (0) | 2025.02.02 |
패스트캠퍼스 환급챌린지 1일차 미션(2월1일):프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 강의후기 (0) | 2025.02.01 |