홈페이지 통합검색
검색
홈 > 각종 DB 검색 > 보유기술DB
보유기술DB
보유기술 상세정보
보유기술 상세정보
기술명 코퍼스 오류 자동 검출 및 수정 장치
발명자 차정원 교수
전공분야 컴퓨터
주요연구분야
발명자소속
기술개요
1. 자연어 처리를 위한 인식 및 분류기 생성을 위해 학습에 필요한 코퍼스에 포함되는
오류를 검출하여 정량화 및 수정

2. 입력된 코퍼스에 포함된 어절들에 대하여 러프 셋 이론을 적용하여
형태소품사 태깅 코퍼스 오류를 검출
기술의 우수성
1. 정보부착 코퍼스를 가공하여 활용하는 분야 증가
-대량의 코퍼스는 다수의 사람들의 수작업에 의해 제작
-일관성 있는 코퍼스를 제작하기가 매우 어려움
-제작된 코퍼스 오류 검정 또한 수작업으로 진행
-시간과 비용이 크게 발생
-자연어 처리를 위한 코퍼스에 포함되는 오류를 검출하여 정량화하는 것에 의해 오류를 자동으로 수정할 수 있도록 하는 기술이 필요

2. 러프 셋
개념 : 분석의 객관적인 형태 제공
효과 : 코퍼스의 오류를 자동으로 검출 및 수정
형태소 품사 태깅
개념 : 형태소의 뜻과 문맥을 고려 후 마크업
효과 : 불필요한 품사들을 제거하는 전처리
관련이미지
관련이미지
관련이미지
목록