Электронный архив НГУ

Технология автоматизированного наполнения онтологии фактографической поисковой системы

Показать сокращенную информацию

dc.contributor.author Барахнин, Владимир Борисович ru_RU
dc.contributor.author Пастушков, Илья Сергеевич ru_RU
dc.creator Институт вычислительных технологий СО РАН ru_RU
dc.creator Новосибирский государственный университет ru_RU
dc.creator Novosibirsk State University en_EN
dc.creator Institute of Computational Technologies SB RAS en_EN
dc.date.accessioned 2016-02-25T04:40:48Z
dc.date.available 2016-02-25T04:40:48Z
dc.date.issued 2015-11
dc.identifier.citation Барахнин В. Б., Пастушков И. С. Технология автоматизированного наполнения онтологии фактографической поисковой системы // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, вып. 4. С. 5–13. ru_RU
dc.identifier.citation Barakhnin V. B., Pastushkov I. S. Technology of automated factographic retrieval system’s ontology filling // Vestnik NSU Series: Information Technologies. - 2015. - Volume 13, Issue No 4. - P. 5–13. - ISSN 1818-7900. (in Russian). en_EN
dc.identifier.issn 1818-7900
dc.identifier.uri https://lib.nsu.ru/xmlui/handle/nsu/10148
dc.description.abstract В работе излагается технология автоматизированного наполнения онтологии фактографической поисковой системы. Суть технологии заключается в извлечении ключевых слов (словосочетаний) из корпуса текстов однородной тематики с целью дальнейшего использования извлеченных ключевых слов в качестве возможных значений атрибутов сущностей, описываемых в создаваемой онтологии предметной области, предназначенной для организации фактографического поиска в расширенном корпусе текстов соответствующей тематики. Предлагаемая технология основана на применении метода опорных векторов для разметки в текстах частей речи с после-дующим использованием метода случайных блужданий для извлечения семантически связанных ключевых слов (словосочетаний). К набору этих словосочетаний с целью отнесения конкретного словосочетания к определенному атрибуту описываемой в тексте сущности применяется обученная нейронная сеть со скрытым слоем. Таким образом, по набору семантически связанных пар слов строится онтология для конкретного документа, формирующаяся при работе нейронной сети, и далее с использованием СУБД на основе полученных данных организуется поиск. ru_RU
dc.description.abstract This work is about technology of automated factographic retrieval system ontology filling . This technology contains extracting keywords from corpus of texts with similar topic for following using these keywords as possible values of entity’s attributes, that describes in created ontology of subject field for organizing of factographic retrieval in expanded corpus of text appropriated topics. Sug-gested technology based on support vector model for stamming text and following random-walk method for extracting keywords. After learned hidden layer neural network works with set of these keywords. So, ontology for document formed in neural network working builds by the set of seman-tic connected pairs of words and after with use of database search organizing. en_EN
dc.description.sponsorship Работа выполнена при частичной поддержке РФФИ (проект 13-07-00258) и президентской программы «Ведущие научные школы РФ» (грант 5006.2014.9). ru_RU
dc.language.iso ru ru_RU
dc.publisher Новосибирский государственный университет ru_RU
dc.subject Факт ru_RU
dc.subject Фактографический поиск ru_RU
dc.subject Интеллектуальные системы ru_RU
dc.subject Извлечение фактов ru_RU
dc.subject Автоматизированное наполнение онтологий ru_RU
dc.subject Fact en_EN
dc.subject Factogaphic retrieval en_EN
dc.subject Intelligent systems en_EN
dc.subject Facts extraction en_EN
dc.subject Automated ontology filling en_EN
dc.title Технология автоматизированного наполнения онтологии фактографической поисковой системы ru_RU
dc.title.alternative Technology of automated factographic retrieval system’s ontology filling en_EN
dc.type Article ru_RU
dc.description.reference 1. Барахнин В. Б., Федотов А. М. Построение модели фактографического поиска // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2013. Т. 11, вып. 4. С. 16–27. 2. Wittgenstein L. Logisch-Philosophische Abhandlung // Annalen der Naturphilosophie. Leip-zig: Verlag Unesma, 1921. Vol. 14. Parts 3/4. P. 185–262. 3. Chen P. P. The entity-relational model. Toward a unified view of data // ACM TODS. 1976. № 1. P. 9–36. 4. Барахнин В. Б., Федотов А. М. Уточнение терминологии, используемой при описании интеллектуальных информационных систем, на основе семиотического подхода // Изв. вузов. Проблемы полиграфии и издательского дела. 2008. № 6. С. 73–81. 5. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М.: Наука, 1968. 6. Добров Б. В., Лукашевич Н. В., Синицын М. Н., Шапкин В. Н. Разработка лингвистиче-ской онтологии по естественным наукам для решения задач информационного поиска // Тр. VII Всерос. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2005). Ярославль, 2005. С. 70–79. 7. Welty C., McGuinness D., Uschold M., Gruninger M., Lehmann F. Ontologies: Expert Sys-tems all over again // AAAI-1999 Invited Panel Presentation. 1999. 8. Нариньяни А. С. Кентавр по имени ТЕОН: Тезаурус + Онтология // Тр. междунар. се-минара «Диалог'2001» по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Т. 1. C. 184–188. 9. Хайкин С. Нейронные сети. Полный курс. 2-е изд., испр.: Пер. с англ. М.: ООО «И. Д. Вильямс», 2006. 10. Bellaachia A., Al-Dhelaan M. HG-RANK: A Hypergraph-based Keyphrase Extraction for Short Documents in Dynamic Genre. // Making Sense of Microposts (# Microposts2014). http://ceur-ws.org/Vol-1141/paper_06.pdf ru_RU
dc.description.reference 1. Barakhnin V. B., Fedotov A. M. A model of factographic retrieval // Vestnik NSU: Infor-mation Technologies 2013. Vol. 11. N 4. P. 16–27. ISSN 1818-7900. (in Russian) 2. Wittgenstein L. Logisch-Philosophische Abhandlung // Annalen der Naturphilosophie. Vol. XIV. Parts 3/4. Leipzig: Verlag Unesma, 1921. P. 185–262. 3. Chen P. P. The entity-relational model. Toward a unified view of data // ACM TODS. 1976. № 1. P. 9–36. 4. Barakhnin V. B., Fedotov A. M. Clarification of the Terminology Used in the Description of Intellectual Information Systems, Based on the Semiotic Approach // Izvestiya VUZ: Problems of printing and publishing. 2008. № 6. P. 73–81. 5. Mikhailov A. I., Chernyi A. I., Gilyarevskyi R. S. Fundamentals of Informatics. Moscow: Nauka, 1968. 6. Dobrov B. V., Loukachevitch N. V., Sinitsyn M. N., Shapkin V. N. Development of Linguis-tic Ontology on Natural Sciences for Information Retrieval Purposes // Proceedings of the Seventh Anniversary of All-Russian Scientific Conference «Digital Libraries: Advanced Methods and Tech-nologies, Digital Collections» (RCDL’2005). Yaroslavl, 2005. P. 70–79. 7. Welty C., McGuinness D., Uschold M., Gruninger M., Lehmann F. Ontologies: Expert Sys-tems all over again // AAAI-1999 Invited Panel Presentation. 1999. 8. Narin'yani A. S. A centaur by name of «THEON»: Thesaurus + Ontology // Proceedings of the DIALOG'2001 International Workshop. Aksakovo, 2001. Vol. 1. P. 184–188. 9. Haykin S. Neural Networks: A Comprehensive Foundation, 2nd Edition. NJ: Prentice-Hall, 1998. 10. Bellaachia A., Al-Dhelaan M. HG-RANK: A Hypergraph-based Keyphrase Extraction for Short Documents in Dynamic Genre. // Making Sense of Microposts (# Microposts2014 http://ceur-ws.org/Vol-1141/paper_06.pdf en_EN
dc.subject.udc 004.8
dc.relation.ispartofvolume 13
dc.relation.ispartofnumber 4
dc.relation.ispartofpages 5-13


Файлы в этом документе

Данный элемент включен в следующие коллекции

Показать сокращенную информацию