dc.contributor.author |
Нугуманова, Алия Багдатовна |
ru_RU |
dc.contributor.author |
Байбурин, Ержан Мухаметкалиевич |
ru_RU |
dc.contributor.author |
Мансурова, Мадина Есимхановна |
ru_RU |
dc.contributor.author |
Барахнин, Владимир Борисович |
ru_RU |
dc.contributor.author |
Nugumanova, Aliya Bagdatovna |
en |
dc.contributor.author |
Bayburin, Erzhan Mukhametkaliyevich |
en |
dc.contributor.author |
Mansurova, Madina Esimkhanovna |
en |
dc.contributor.author |
Barakhnin, Vladimir Borisovich |
en |
dc.creator |
Восточно-Казахстанский государственный университет им. С. Аманжолова |
ru_RU |
dc.creator |
Казахский национальный университет им. аль-Фараби |
ru_RU |
dc.creator |
Институт вычислительных технологий СО РАН |
ru_RU |
dc.creator |
Новосибирский государственный университет |
ru_RU |
dc.creator |
Sarsen Amanzholov East-Kazakhstan State University |
en |
dc.creator |
Al-Farabi Kazakh National University |
en |
dc.creator |
Institute of Computational Technologies SB RAS |
en |
dc.creator |
Novosibirsk State University |
en |
dc.date.accessioned |
2018-12-18T10:51:31Z |
|
dc.date.available |
2018-12-18T10:51:31Z |
|
dc.date.issued |
2018-12 |
|
dc.identifier.citation |
Нугуманова А. Б., Байбурин Е. М., Мансурова М. Е., Барахнин В. Б. Автоматическое извлечение решеток понятий из медицинских текстов на основе комбинации анализа формальных понятий и технологий бутстраппинга // Вестн. НГУ. Серия: Информационные технологии. 2018. Т. 16, № 4. С. 140–152. DOI 10.25205/1818-7900-2018-16-4-140-152 |
ru_RU |
dc.identifier.citation |
Nugumanova A. B., Bayburin E. M., Mansurova M. E., Barakhnin V. B. Automatic Extraction of Formal Lattices from Medical Texts Based on The Combination of the Formal Concept Analysis
and Bootstrapping Technologies. Vestnik NSU. Series: Information Technologies, 2018, vol. 16, no. 4, p. 140–152. (in Russ.) DOI 10.25205/1818-7900-2018-16-4-140-152 |
ru_RU |
dc.identifier.issn |
1818-7900 |
|
dc.identifier.issn |
2410-0420 |
|
dc.identifier.other |
DOI 10.25205/1818-7900-2018-16-4-140-152 |
|
dc.identifier.uri |
https://lib.nsu.ru/xmlui/handle/nsu/15255 |
|
dc.description.abstract |
Рассматривается новый способ извлечения понятий из текстов предметной области на основе комбинации анализа формальных понятий и бутстрап-технологии информационного поиска. Анализ формальных понятий представляет собой мощный аппарат автоматического вывода понятий предметной области, однако он рассчитан на высокое качество входных данных, без пропусков и неточностей. Получение таких наборов данных напрямую
из текстов затруднено в силу сильной разреженности текстовых корпусов. Соответственно, представляется перспективным улучшение качества входных данных за счет применения бутстраппинга – технологии, обеспечивающей интеллектуальный поиск фрагментированной информации в сети Интернет. Цель данной работы – показать, что при правильном выборе исходных шаблонов поиска бутстраппинг, основанный на использовании открытых ресурсов Интернета как ценных источников знаний, превращается в эффективный инструмент поддержки концептуального моделирования. |
ru_RU |
dc.description.abstract |
The article considers a new way of concept extraction from the subject domain texts based on combination of formal concept analysis and bootstrap technology of information retrieval. Formal concept analysis is a powerful way of automatically deriving the domain concepts, but it is designed for high quality input data, without missing and inaccuracies. Obtaining such datasets directly from texts is difficult because of the strong sparsity of the text corpora. Accordingly, it seems promising to improve the quality of input data with bootstrapping, a technology that provides an intelligent search for fragmented information on the Internet. In this paper, we show the steps of implementing the way of automatically concept extraction from medical texts based on the filling of blanks in highly sparse matrices of the joint occurrence of terms. The input data for formal concept analysis is represented in the form of an object-feature table that reflects the distribution of attributes over the objects of the domain. The purpose of this paper is to show that with proper selection of initial search patterns, bootstrapping based on the use of open Internet resources as valuable sources of knowledge, turns into an effective tool for supporting conceptual modeling. |
en |
dc.description.sponsorship |
Работа выполнена при частичной поддержке РФФИ (проект 18-07-01457) |
ru_RU |
dc.language.iso |
ru |
ru_RU |
dc.subject |
анализ формальных понятий |
ru_RU |
dc.subject |
бутстраппинг |
ru_RU |
dc.subject |
извлечение информации |
ru_RU |
dc.subject |
поверхностный лингвистический анализ |
ru_RU |
dc.subject |
информационный поиск |
ru_RU |
dc.subject |
formal concept analysis |
en |
dc.subject |
bootstrapping |
en |
dc.subject |
information extraction |
en |
dc.subject |
urface linguistic analysis |
en |
dc.subject |
information retrieval |
en |
dc.title |
Автоматическое извлечение решеток понятий из медицинских текстов на основе комбинации анализа формальных понятий и технологий бутстраппинга |
ru_RU |
dc.title.alternative |
Automatic Extraction of Formal Lattices from Medical Texts Based on The Combination of the Formal Concept Analysis and Bootstrapping Technologies |
en |
dc.type |
Article |
ru_RU |