프로젝트 배경
1) 배경
클로바 노트는 자동 회의록을 위한 음성인식 엔진이 탑재되어 있습니다. 사용자들은 이걸 통해서 또 다시 2차적인 정제를 통해 데이터를 가공하여 사용합니다. 이러한 배경을 바탕으로 일반적인 어시스턴트 기능들 도입을 위해 여러가지 애플리케이션들을 기획하고 개발하였습니다.
클로바 노트는 자동 회의록을 위한 음성인식 엔진이 탑재되어 있습니다. 사용자들은 이걸 통해서 또 다시 2차적인 정제를 통해 데이터를 가공하여 사용합니다. 이러한 배경을 바탕으로 일반적인 어시스턴트 기능들 도입을 위해 여러가지 애플리케이션들을 기획하고 개발하였습니다.
프로젝트 성과
키워드 추출 개발
사용자가 노트를 편하게 파악하도록 키워드 추출기를 개발하였습니다.
요약 모델 개발
사용자가 요약된 회의록을 볼 수 있도록 모델을 개발하였습니다.
하이브리드 서치 개발
Vector search와 BM25를 통해 유저 질문에 대한 AI 답변을 할 수 있는 엔진을 연구 개발하였습니다.
Disfluent Words 제거 모델
음, 아, 어와 같이 대화에서 불 필요한 단어들을 제거하는 모델을 개발하였습니다.
키워드 부스팅
주요 키워드 인식률을 높이기 위한 알고리즘 개발
핵심 기능
키워드 추출
회의록에서 주요 키워드를 추출
요약 기능
회의록을 요약하는 모델 개발
키워드 부스팅
주식명 또는 의료 용어와 같은 전문 용어의 인식률을 높이는 알고리즘 개발
진행 단계
개발
2021.12.
사내에서 기획된 내용들을 바탕으로 개발하였습니다.
프로젝트 상세
1) 포트폴리오 소개
네이버에서 정규직 머신러닝 엔지니어로 근무하였습니다. 근무 당시 클로바노트
모든 회의를 기록, 요약하는 업무용 AI 회의록 클로바노트
2) 작업 범위
- 키워드 추출 코어 엔진 개발
- 키워드 추출 서빙 시스템 개발
- 요약 모델 개발
- 하이브리드 검색 엔진 연구 개발
- 음성인식 시 주식 종목, 의료 키워드와 같은 인식이 어려운 단어들의 인식률을 높히기 위한 키워드 부스팅 로직 개선
네이버에서 정규직 머신러닝 엔지니어로 근무하였습니다. 근무 당시 클로바노트
모든 회의를 기록, 요약하는 업무용 AI 회의록 클로바노트
2) 작업 범위
- 키워드 추출 코어 엔진 개발
- 키워드 추출 서빙 시스템 개발
- 요약 모델 개발
- 하이브리드 검색 엔진 연구 개발
- 음성인식 시 주식 종목, 의료 키워드와 같은 인식이 어려운 단어들의 인식률을 높히기 위한 키워드 부스팅 로직 개선

회의록 키워드 추출 결과 예시

회의록 자동 요약 결과 예시