Проект РФФИ № 14-07-00903 "Теоретико-модельные методы интеграции знаний и порождения новых знаний"

Проект посвящен разработке теоретико-модельных методов извлечения знаний из текстов естественного языка, представления, интеграции знаний и порождения новых знаний.

Разработан теоретико-модельный подход к извлечению знаний из текстов естественного языка, основанный на формальном представлении извлекаемых знаний в виде конечных фрагментов атомарных диаграмм алгебраических систем. Разработаны автоматизированные методы построения атомарных диаграмм алгебраических систем по текстам русского языка. Разработана программная система, которая осуществляет порождение фрагмента атомарной диаграммы модели по тексту естественного языка. Разработана вопросно-ответная система на русском языке, осуществляющая поиск информации в Интернете при помощи параметризированных запросов. Разработана вопросно-ответная система «QA-RiskPanel» для предметной области «компьютерная безопасность». Разработаны методы интеграции знаний, извлеченных из разных текстов естественного языка. Интеграция знаний осуществляется на основе предложенной четырехуровневой модели представления знаний. Разработаны автоматизированные методы построения онтологических моделей предметных областей: онтологическая модель включает в себя онтологию предметной области; теорию предметной области, содержащую универсальные теоретические знания о предметной области; эмпирические знания, представленные множеством прецедентов предметной области; нечеткие оценочные знания о предметной области, формализуемые на языке нечетких моделей. Для построения онтологической модели производится интеграция содержательных знаний о предметной области, представленных в различных текстах естественного языка: как универсальных теоретических знаний, так и знаний о конкретных прецедентах предметной области. При этом производится контроль совместной непротиворечивости объединяемых знаний – как онтологических, так и содержательных. Разработанные методы применены для построения онтологических моделей предметных областей в медицине.  Исследованы теоретико-модельные свойства булевозначных моделей и нечетких моделей. Разработан алгоритм нахождения нечеткого значения истинности бескванторного предложения  на обобщенных нечетких моделях. Исследованы теоретико-модельные и алгоритмические свойства булевых алгебр в обогащенной сигнатуре. Исследованы вопросы об изоморфной вложимости полугрупп элементарных типов обогащенных булевых алгебр. Разработаны методы теоретико-модельной формализации отношений между понятиями. Разработаны алгоритмы интеграции нечетких знаний, полученных от экспертов и оценочных знаний, хранящихся в онтологической модели. Разработаны методы и алгоритмы извлечения чисто онтологической информации из текстов естественного языка. Разработаны теоретико-модельные методы извлечения из текстов онтологических пресуппозиций, методы извлечения из текстов знаний о смысле понятий. На основе этих методов определяется, какой конкретной онтологии соответствует данный текст естественного языка. Исследована проблема полноты определений понятий относительно фиксированного контекста. Разработаны методы порождения в онтологической модели новых знаний, исходя из уже имеющихся, основанные на  реализации логического вывода в разрешимом фрагменте логики предикатов. Разработаны методы порождения новых нечетких и оценочных знаний, основанные на представлении прецедентных знаний при помощи булевозначных моделей и на вычислении значений истинности предложений в соответствующих нечетких моделях. Методы порождения новых знаний применены для предметной области мобильной связи. Разработаны методы порождения знаний о том, какие виды тарифных планов и услуг операторов мобильной связи в наибольшей степени удовлетворяют потребности данного абонента. Разработанные методы порождения нечетких и оценочных знаний также применены для порождения знаний о возможном диагнозе пациента на основе анализа историй болезни других пациентов.