패스트캠퍼스 환급 챌린지

패스트캠퍼스 환급챌린지 25일차 미션(2월25일):프롬프트 엔지니어링으로 시작하는 AI/LLM 서비스 개발 강의후기

foruheon 2025. 2. 25. 23:27

본 포스팅은 패스트캠퍼스 환급 챌린지 참여를 위해 작성하였습니다.

 

강의 내용은 뉴스 데이터를 정리하는 AI 봇을 구축하기 위한 개체명 인식(NER) 기술에 대해 설명하는 것이었습니다. 강의를 통해 NER의 핵심 개념과, 텍스트에서 중요한 개체(사람, 장소, 날짜 등)를 찾아내고 분류하는 방법을 배울 수 있었습니다. NER은 두 가지 주요 과정인 개체명 식별과 개체명 분류를 포함하며, 이를 통해 뉴스 기사를 분석하고 정리하는 데 중요한 역할을 할 수 있다는 점이 강조되었습니다. 강의에서는 특히 뉴스 데이터에서 NER을 활용하는 사례, 예를 들어 특정 기업 관련 뉴스 분류나 정치인 언급 분석 방법을 소개하며, 금융 도메인에서는 기업명이나 경제 지표 추출 기술을 다뤘습니다. 이 정보를 통해 투자 분석이나 리포트 자동 생성 등 실무에 응용할 수 있는 방법을 배울 수 있었습니다. 그러나 강의를 들으며 아쉬운 점도 있었습니다. 이론 설명은 이해하기 쉬웠으나, 실제 뉴스 데이터를 사용한 실습이 부족하여 실전에서 NER을 어떻게 적용할지에 대한 감은 부족했던 점이 그 중 하나였습니다. 실습을 통해 실제로 NER 모델을 만들어보는 과정이 추가되었다면 더 효과적이었을 것입니다. 또한 한국어 데이터에서의 처리 난이도도 다뤄졌는데, 띄어쓰기 문제나 동음이의어 문제는 한국어에서 NER 모델을 적용하기 어렵게 만드는 요소들입니다. 이에 대한 해결책을 좀 더 구체적으로 다루었다면 좋았을 것 같습니다. 또한 금융 도메인에서 개체명 인식을 어떻게 실용적으로 활용할 수 있는지에 대해 더 심도 있는 설명이 제공되었으면 좋았겠습니다. 예를 들어, 특정 기업의 언급 빈도와 주가 변화의 관계를 분석하는 구체적인 예시가 포함되었다면 더욱 유익했을 것이라고 생각합니다. 강의의 총평을 내리자면, NER 개념을 이해하는 데는 충분히 유용했지만, 실습 부족과 한국어 데이터의 문제 해결 방법, 금융 도메인에서의 활용법에 대한 심화 내용이 부족했던 점이 아쉬웠습니다.

이번 강의는 뉴스 데이터를 정리하는 AI 봇을 개발하기 위해 개체명 인식(NER) 기술을 어떻게 활용할 수 있는지를 집중적으로 설명하였다. 강의에서는 뉴스 기사에서 사람, 장소, 조직, 날짜 등 중요한 정보를 자동으로 찾아내고 이를 분류하는 방법에 대해 이론과 사례를 통해 소개하였다. NER의 기본 개념은 크게 두 가지로 나뉜다. 첫째, 문장에서 특정 개체를 찾아내는 개체명 식별(Entity Detection)이며, 둘째, 식별된 개체를 사전 정의된 카테고리(예: 인물, 장소, 조직, 날짜 등)로 분류하는 개체명 분류(Entity Classification)이다.

특히, 뉴스 데이터의 방대한 양을 고려할 때 NER 기술은 매우 유용하다. 예를 들어, 특정 기업과 관련된 기사를 자동으로 분류하거나 정치인들의 언급 빈도를 분석하는 데 활용할 수 있다는 점이 강조되었다. 또한 금융 도메인에의 적용 가능성도 언급되었는데, 금융 뉴스에서는 기업명, 주가, 경제 지표 등의 정보를 추출하여 투자 분석이나 자동 리포트 생성 등 다양한 실무 응용이 가능하다는 점이 인상 깊었다.

하지만 강의를 들으며 느낀 점은 이론적인 설명은 충분히 이루어졌으나, 실제 뉴스 데이터를 활용해 직접 NER 모델을 구현하거나 테스트하는 실습이 부족하다는 것이다. 파이썬을 이용한 간단한 NER 모델 실습이 포함되었다면, 이론과 실무의 연결고리를 더욱 명확하게 체감할 수 있었을 것으로 보인다.

또한, 영어 뉴스 데이터에서는 NER 모델이 비교적 원활하게 작동하는 반면, 한국어 데이터의 경우 띄어쓰기 문제나 동음이의어 등의 언어적 특성 때문에 처리 과정이 훨씬 까다롭다는 점도 흥미롭게 다가왔다. 예를 들어, ‘이상’이라는 단어가 사람 이름일 수도 있고, 일반적인 의미로 사용될 수도 있기 때문에 문맥을 정확하게 파악하는 것이 필수적이다. 강의에서는 이러한 문제의 해결 방법에 대해서는 깊이 다루지 않아, 추후 별도의 학습이 필요하다는 아쉬움이 남았다.

마지막으로, 금융 데이터와 결합한 활용법이 좀 더 심도 있게 다뤄졌다면 더욱 실용적이었을 것으로 생각된다. 금융 뉴스에서 추출한 기업명이나 경제 지표를 실제 데이터 분석과 연계하여, 예를 들어 기업이 뉴스에 많이 언급될수록 주가에 어떤 영향을 미치는지 분석하는 내용이 포함되었다면, 이론뿐 아니라 실무에서의 적용 가능성을 한층 더 높일 수 있었을 것이다.

종합적으로 이번 강의는 NER 기술의 기본 원리와 뉴스 데이터를 정리하는 데 있어 중요한 역할을 하는 개념들을 이해하는 데 큰 도움이 되었으나, 실습 부족과 한국어 데이터 처리의 어려움, 그리고 금융 도메인에서의 구체적 응용 사례가 다소 부족하다는 점에서 개선의 여지가 있다는 생각을 하게 되었다. 이러한 점들을 보완하여 향후 강의가 진행된다면, 뉴스 데이터를 기반으로 한 AI 봇 개발에 실질적인 도움이 될 것으로 기대된다.

 

① 오늘자 날짜, 공부 시작 시각

 

② 오늘자 날짜, 공료 시각

 

③ 클립 1번 수강 인증 사진

 

④ 클립 2번 수강 인증 사진

 

⑤ 학습 인증샷 1장 이상 (ex. 필기 촬영, 작업물, 등)

 

 

 

 

 

 

https://bit.ly/4gL1f1o