Оформить заказ Продолжить покупки
x
  • 0
Вход

Искусственный интеллект: как расширить словарный запас

12, Июль 2017

Руководитель проектов компании «Телефонные системы» Константин Кондратьев и доцент кафедры английской филологии факультета иностранных языков МарГУ Ксения Балышева выступили на воркшопе OntoLex в рамках международной конференции LDK2017.

IMG_1497894917217-1.jpg

Проходила конференция 18-21 июня в городе Голуэй, Ирландия. OntoLex - модель представления лингвистических данных и их связи с понятиями в онтологиях предметных областей.

IMG_1497895906314-1.jpg

Константин и Ксения выступили с презентацией, созданной на основе статьи, написанной коллективом авторов: Е.Карташовой, К.Балышевой, К.Кондратьевым, А.Михеевым, и представляющей результаты работы лаборатории AI-Labs Марийского государственного университета. 

В статье описываются изменения в онтологии LexInfo, которая является модулем OntoLex и позволяет представлять свойства слов и предложений. Изменения касаются описания свойств слов. Например, таких частей речи, как краткое причастие, краткое прилагательное, деепричастие и других морфолого-синтаксических свойств слов, присущих не только русскому языку.

IMG_1498039279623-1.jpg

Данную обновленную схему представления морфолого-синтаксических свойств слов разработчики  использовали для создания словаря морфологических форм слов русского языка, Ontology-based Dictionary of Russian Grammatical Forms или сокращенно OntoRuGrammaForm. Словарь доступен для публичного использования по ссылке http://ldf.kloud.one.

На сегодняшний день словарь содержит около 380 000 словарных статей и примерно 5,5 млн. слов.

Более того, для словаря создан инструмент поиска, доступный по ссылке http://sw.kloud.one, работающий пока что в экспериментальном режиме.

- В нашем докладе также была затронута тема визуализации онтологий, по структуре напоминающих словарь, где у каждого слова есть множество свойств - части речи, род, падеж и другие, - рассказал Константин Кондратьев. - Данный метод визуализации пока находится в стадии разработки. Его  рабочее название – Terrapin.

Описанные технологии применяются в задачах информационного поиска, в бизнес-аналитике, а самое интересное - подобные структуры данных (онтологии) применяются для описания моделей мышления, то есть для создания искусственного интеллекта.

ПОДПИСАТЬСЯ

Этот сайт использует файлы cookies для более комфортной работы пользователя. Продолжая просмотр страниц сайта, вы соглашаетесь с использованием файлов cookies. Если вам нужна дополнительная информация или вы не хотите соглашаться с использованием cookies, пожалуйста, посетите страницу Использование файлов cookies.

Согласен
Перейти