"Семограф" будет усовершенствован. Ученые ПГНИУ получили грант на развитие информационной системы анализа языкового контента



Проект многопользовательского веб-приложения для анализа текстовой информации «Семограф», разработанный лингвистами и математиками Пермского университета, стал победителем грантового конкурса «Старт – Цифровые платформы» Фонда содействия инновациям. В рамках гранта ученые займутся вопросами автоматизации процесса анализа языкового контента и коммерциализации идеи.

«Система "Семограф" применяется для решения ряда задач, связанных с экспертным анализом текстовой информации, что особенно актуально для лингвистов. Социологам, психологам, маркетологам, историкам и специалистам других гуманитарных областей важен процесс автоматической обработки и анализа текста. Над автоматизацией процесса мы сейчас и работаем», – рассказал профессор кафедры теоретического и прикладного языкознания ПГНИУ Константин Белоусов.
 
Первая версия «Семографа» появилась в 2009 году. С тех пор программа совершенствовалась, сейчас она выполняет полный цикл исследования языкового контента: от сбора данных, проведения экспертного анализа до построения графосемантических моделей и регистрации проекта как базы данных в Роспатенте.
 
Так, например, при помощи системы «Семограф» учёные ПГНИУ разработали программу, которая позволяет с точностью до 70% определять психологические параметры собеседника на основе его комментариев в соцсетях, реконструировали имиджевый портрет продукции автомобильной компании на основе мнений интернет-пользователей.
 

 
Коммерциализация проекта предполагается за счет размещаемых авторами на платформе Semograph Store информационных (датасеты, программные модули, шаблоны) и знаниевых продуктов (лексические библиотеки, тезаурусы).
 
«Авторами могут стать все, кто зарегистрируется в системе. Например, в результате научной работы, пользователь может создать базу данных. Сейчас мы работаем над разделом, где авторы будут размещать полученные данные и назначать за них цену. Другой пользователь сможет выкупить необходимый ему информационный продукт», – комментирует Константин Белоусов.
 
Информационная система находится в открытом доступе. Подробнее ознакомиться с возможностями «Семографа» можно здесь, новости об обновлениях в системе публикуются на канале «Семограф» в Телеграме.
 
Проект будет выполняться компанией ООО «ХЬЮМЕН СЕМАНТИКС», учредителями которой являются профессор кафедры теоретического и прикладного языкознания ПГНИУ Константин Белоусов и научный сотрудник учебно-научной лаборатории социокогнитивной и компьютерной лингвистики ПГНИУ Дмитрий Баранов.
 
Пресс-служба