Информационные системы


Лаборатория «Лингвистические платформы»


Начиная с 2013 года под руководством г.н.с., д.ф.н. Ю.В.Норманской ведется создание платформы ЛингвоДок lingvodoc.ispras.ru, на которой в настоящее время собраны аудиословари и корпуса более чем на 450 исчезающих диалектах уральских и алтайских языков России.
Помимо места для хранения данных и поиска данных на этой платформе есть возможность одновременной распределенной обработки материала и программы для его анализа, в частности, выявления в он-лайн режиме фонетического сходства языков, употребления тех или иных морфологических параметров в определенном значении, возможности построения карт фонетических, морфологических или лексических изоглосс в синхронии и их изменений в диахронии. 
На платформе ЛингвоДок есть возможность размещения данных пользователей из различных организаций с сохранением всех прав создателей словарей и корпусов, возможности работы с данными в режиме, когда материалы открыты только ограниченному числу пользователей, выбранных создателем словаря или корпуса. Но при этом для каждого пользователя ЛингвоДока появляется возможность сравнения данных его словарей по любым параметрам с данным других диалектов с помощью авторских программ сотрудников Лаборатории. Благодаря тому, что на платформе уже сейчас представлены материалы в едином цифровом формате по 450 диалектам уральских и алтайских языков России, суммарный объем которых превышает 2 миллиона словоформ, то анализ сравнительный-исторический, фонетический, морфологический анализ проводится методом обсчета больших данных, что значительно повышает точность полученного результата. 
В настоящее время ведется работа в коллаборации с создателями национальных корпусов языков России, создание специальной среды для применения парсеров в он-лайн режиме, снятия омонимии, выявления коллакационных сочетаний. Планируется создание специальных программ для корпусного описания морфологии. На основании более полного описания морфологии планируется создания учебных платформ на базе Revita в сотрудничестве в учеными из Хельсинского университета и филиала НИУ «Высшая школа экономики» в Санкт-Петербурге.
На базе Лаборатории с 2020 года будут проводиться курсы повышения квалификации «Цифровые методы для описания языков народов России», где слушатели получат информацию о всех возможностях платформы ЛингвоДок и получат в индивидуальном режиме указания о возможностях обработки именно их материала.