Целью данной работы являлось исследование применимости грамматики связей и создание инструмента для автоматического разбора предложений на казахском и турецком языках. Такой выбор языков обусловлен активным распространением исламской культуры и тем, что тексты на этих языках широко представлены в интернете. В качестве инструмента выбран анализатор Link Grammar Parser, для составления подключаемых словарей применялись приемы из логики исчисления предикатов. В статье продемонстрирована связность различных уровней анализа, предложен подход, позволяющий учесть семантические отношения уже на этапах морфологического и синтаксического анализа. Описана модель семантической разметки предложений. Ведется работа по увеличению подключаемых словарей. В будущем планируется расширить список семантических связей для разметки текстов, чтобы применять полученные результаты при создании систем определения тем текстов и систем автоматического резюмирования.
The purpose of this work is to study the applicability of the link grammar to the Kazakh and Turkish languages. Our choice of these languages is determined by increasing spread of the Islam culture and the fact that texts in these languages are widely represented on the Internet, but investigations of the syntax and semantics structure of the Kazakh and Turkish languages are slightly presented. Therefore text processing in these languages is a challenge. Link Grammar Parser was selected as a tool for parsing. We used the methods of first-order predicate calculus to compile plug-in dictionaries. The coherence of different levels of analysis by the example of Turkic languages was demonstrated. An approach that allows to take into account the semantic links during morphological and syntactic levels was proposed. A model of semantic markup of sentences was described in this paper. We are working to extend the dictionaries for the Link Grammar Parser. In the future we plan to expand the list of links for markup of a text (sequences of related sentences) to be able to use the results to create topic identification systems and automatic summarization systems.