Разрабатывается теоретико-модельный подход к извлечению знаний из текстов естественного языка. Подход основан на формальном представлении извлекаемых знаний в виде конечных подмножеств атомарных диаграмм алгебраических систем. Описаны и реализованы в виде программной системы методы автоматизированного по-строения атомарных диаграмм моделей по текстам на русском языке. Разработаны словари существительных-номинализаций и валентностей глаголов.
The paper is devoted to a model-theoretical approach to the knowledge extraction from the natural language texts. The approach is based on a formal representation of extracted knowledge in terms of the finite subsets of atomic diagrams of algebraic systems. Methods of a semi automatic construction of the atomic diagrams from texts in Russian are described in the paper and are implemented as a program system. A set of dictionaries (nominalizations and verbs valences) was developed.