Устранение лексической многозначности терминов Википедии на основе Скрытой Модели Маркова.


Устранение лексической многозначности терминов Википедии на основе Скрытой Модели Маркова.

Авторы

Турдаков Д.

Аннотация

В статье описывается способ автоматического устранения лексической многозначности терминов естественного языка, использующий открытую энциклопедию Википедию. Рассматриваются проблемы применения существующих алгоритмов, и предлагается собственный метод, основанный на скрытой модели Маркова, параметры которой вычисляются на основе словаря и ссылочной структуры Википедии. Также, предлагается эвристика для ускорения описанного алгоритма, и приводятся экспериментальные оценки точности на различных тестовых корпусах.

Полный текст статьи в формате pdf

Издание

Труды 11-й Всероссийской научной конференции «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» - RCDL’2009, Петрозаводск, Россия, 2009.

Научная группа

Информационные системы

Все публикации за 2009 год Все публикации