ChatterBot이란?
ChatterBot은 대화 목록을 학습하여 대답할 수 있는 Python 기반의 챗봇 엔진으로, 언어 독립적으로 설계되어 이론상 모든 언어를 학습하고 말할 수 있습니다. ChatterBot은 처음에 대화에 관한 아무 정보도 없는 상태에서 시작하여, 사용자의 쿼리마다 해당 입력과 출력을 기억합니다. 그에 따라 입력이 들어올 때마다 점점 정확도와 반응할 수 있는 가짓수가 증가하는 구조를 갖고 있습니다.
팀원 목록
팀장
jcH0QUb0BefrKxCNnCq4
|
팀원
조규상
|
팀원
최민석
|
팀원
강원모
|
팀원
이승재
|
프로젝트 현황
83명의 컨트리뷰터가 있으며, 가장 활발한 컨트리뷰터의 경우 약 15만 개의 코드를 수정하였다. 2014년부터 5년째 진행중인 프로젝트이며, 현재도 커밋이 이루어지고 있다. 릴리즈는 80번이 이루어진 상태이며, 가장 최근의 릴리즈는 3일 전이다. 현재 오픈된 이슈는 80개이며, 풀리퀘스트는 3개가 올라와 있다. 커밋은 총 1814번 이루어졌다.
활동 방안
일단 기본적으로 issue를 기반으로 코드를 수정한다. 대체적으로 한국어 데이터가 다른 언어에 비해 적다. 그래서 한국어 데이터를 추가함으로써 데이터의 질을 높일 수 있다. 시간이 된다면 ChatterBot의 기반이 되는 머신 러닝을 공부하고, 그 후에 국어 문법에 맞는 알고리즘으로 개선할 수도 있을 것이다.
활동 계획
chatterbot은 머신러닝을 기반으로 하고 있습니다. 머신러닝에 대한 내용은 건드리기 쉽지 않은 내용이므로 주로 data를 추가하는 활동을 할 예정입니다. data에는 언어 별로 폴더가 하나씩 있는데, 저희는 korean 폴더에 data를 추가할 것입니다. 우선 korean 폴더가 english 폴더에 비해 상대적으로 많이 빈약하므로, english 폴더 내의 대화들을 참고하여 이를 korean으로 번역하는 일을 할 것입니다. 그런데, 한국어의 대화와 영어의 대화의 차이로 인해 english 폴더의 대화를 번역하는 것 만으로는 부족할 것입니다. 따라서, 직접 대화를 만들어 추가하는 일도 할 것입니다. 대화를 추가하는 일은 잘 쓰여진 책 등 문헌을 참고하여 정제된 data를 만들어 추가해야 할 것입니다. 대화를 추가하는 일 뿐만 아니라, korean 폴더 내의 대화들 중에서 문법이나 문맥에 잘 맞지 않는 대화를 찾아 그것을 수정하는 일 또한 해야 할 것입니다.