수상작은 지난해 한국정보과학회 논문지에 발표된 논문 중 선정한다. 이번 수상 논문은 지난해 정보과학회논문지 44권 5호에 게재됐다.
논문은 같은 문서에서 단어가 나타나는 일정한 형태를 파악해 이를 이용, 그 문서를 대표하는 주요 키워드를 자동으로 추출하는 방법을 제안하고 있다. 각 문장에서 같이 사용되는 단어가 동시에 나타나는 관계와 그 단어 사이에 포함돼 있는 다른 단어의 수 등을 분석한다.
인하대 김유성 교수(정보통신공학과 박사과정)의 지도로 진행된 이번 연구 결과를 바탕으로 많은 양의 문헌 데이터베이스에서 문헌 별 대표 키워드뿐만 아니라 문서 별 주제 키워드를 빠르고 정확하게 찾아내는 방안을 연구한다는 계획이다. 또 문서 내용과 주제를 자동으로 분류하는 작업도 가능할 것으로 보고 있다.
송광호 학생은 “이번 연구는 대용량의 문서 데이터베이스에서 각 문서를 주제별로 자동 분류할 수 있도록 한다”며 “효율적이고 정확한 온라인 텍스트 검색 시스템 서비스를 제공할 수 있도록 하는데 이번 연구가 좋은 밑거름이 될 것으로 기대한다”고 말했다.
gilbert@heraldcorp.com