Оформить заказ Продолжить покупки
x

Искусственный интеллект: как расширить словарный запас

12, Июль 2017

Руководитель проектов компании «Телефонные системы» Константин Кондратьев и доцент кафедры английской филологии факультета иностранных языков МарГУ Ксения Балышева выступили на воркшопе OntoLex в рамках международной конференции LDK2017.

IMG_1497894917217-1.jpg

Проходила конференция 18-21 июня в городе Голуэй, Ирландия. OntoLex - модель представления лингвистических данных и их связи с понятиями в онтологиях предметных областей.

IMG_1497895906314-1.jpg

Константин и Ксения выступили с презентацией, созданной на основе статьи, написанной коллективом авторов: Е.Карташовой, К.Балышевой, К.Кондратьевым, А.Михеевым, и представляющей результаты работы лаборатории AI-Labs Марийского государственного университета. 

В статье описываются изменения в онтологии LexInfo, которая является модулем OntoLex и позволяет представлять свойства слов и предложений. Изменения касаются описания свойств слов. Например, таких частей речи, как краткое причастие, краткое прилагательное, деепричастие и других морфолого-синтаксических свойств слов, присущих не только русскому языку.

IMG_1498039279623-1.jpg

Данную обновленную схему представления морфолого-синтаксических свойств слов разработчики  использовали для создания словаря морфологических форм слов русского языка, Ontology-based Dictionary of Russian Grammatical Forms или сокращенно OntoRuGrammaForm. Словарь доступен для публичного использования по ссылке http://ldf.kloud.one.

На сегодняшний день словарь содержит около 380 000 словарных статей и примерно 5,5 млн. слов.

Более того, для словаря создан инструмент поиска, доступный по ссылке http://sw.kloud.one, работающий пока что в экспериментальном режиме.

- В нашем докладе также была затронута тема визуализации онтологий, по структуре напоминающих словарь, где у каждого слова есть множество свойств - части речи, род, падеж и другие, - рассказал Константин Кондратьев. - Данный метод визуализации пока находится в стадии разработки. Его  рабочее название – Terrapin.

Описанные технологии применяются в задачах информационного поиска, в бизнес-аналитике, а самое интересное - подобные структуры данных (онтологии) применяются для описания моделей мышления, то есть для создания искусственного интеллекта.

ПОДПИСАТЬСЯ