Показать сокращенную информацию
dc.contributor.author | Барахнин, Владимир Борисович | ru_RU |
dc.contributor.author | Пастушков, Илья Сергеевич | ru_RU |
dc.creator | Институт вычислительных технологий СО РАН | ru_RU |
dc.creator | Новосибирский государственный университет | ru_RU |
dc.creator | Novosibirsk State University | en_EN |
dc.creator | Institute of Computational Technologies SB RAS | en_EN |
dc.date.accessioned | 2016-02-25T04:40:48Z | |
dc.date.available | 2016-02-25T04:40:48Z | |
dc.date.issued | 2015-11 | |
dc.identifier.citation | Барахнин В. Б., Пастушков И. С. Технология автоматизированного наполнения онтологии фактографической поисковой системы // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2015. Т. 13, вып. 4. С. 5–13. | ru_RU |
dc.identifier.citation | Barakhnin V. B., Pastushkov I. S. Technology of automated factographic retrieval system’s ontology filling // Vestnik NSU Series: Information Technologies. - 2015. - Volume 13, Issue No 4. - P. 5–13. - ISSN 1818-7900. (in Russian). | en_EN |
dc.identifier.issn | 1818-7900 | |
dc.identifier.uri | https://lib.nsu.ru/xmlui/handle/nsu/10148 | |
dc.description.abstract | В работе излагается технология автоматизированного наполнения онтологии фактографической поисковой системы. Суть технологии заключается в извлечении ключевых слов (словосочетаний) из корпуса текстов однородной тематики с целью дальнейшего использования извлеченных ключевых слов в качестве возможных значений атрибутов сущностей, описываемых в создаваемой онтологии предметной области, предназначенной для организации фактографического поиска в расширенном корпусе текстов соответствующей тематики. Предлагаемая технология основана на применении метода опорных векторов для разметки в текстах частей речи с после-дующим использованием метода случайных блужданий для извлечения семантически связанных ключевых слов (словосочетаний). К набору этих словосочетаний с целью отнесения конкретного словосочетания к определенному атрибуту описываемой в тексте сущности применяется обученная нейронная сеть со скрытым слоем. Таким образом, по набору семантически связанных пар слов строится онтология для конкретного документа, формирующаяся при работе нейронной сети, и далее с использованием СУБД на основе полученных данных организуется поиск. | ru_RU |
dc.description.abstract | This work is about technology of automated factographic retrieval system ontology filling . This technology contains extracting keywords from corpus of texts with similar topic for following using these keywords as possible values of entity’s attributes, that describes in created ontology of subject field for organizing of factographic retrieval in expanded corpus of text appropriated topics. Sug-gested technology based on support vector model for stamming text and following random-walk method for extracting keywords. After learned hidden layer neural network works with set of these keywords. So, ontology for document formed in neural network working builds by the set of seman-tic connected pairs of words and after with use of database search organizing. | en_EN |
dc.description.sponsorship | Работа выполнена при частичной поддержке РФФИ (проект 13-07-00258) и президентской программы «Ведущие научные школы РФ» (грант 5006.2014.9). | ru_RU |
dc.language.iso | ru | ru_RU |
dc.publisher | Новосибирский государственный университет | ru_RU |
dc.subject | Факт | ru_RU |
dc.subject | Фактографический поиск | ru_RU |
dc.subject | Интеллектуальные системы | ru_RU |
dc.subject | Извлечение фактов | ru_RU |
dc.subject | Автоматизированное наполнение онтологий | ru_RU |
dc.subject | Fact | en_EN |
dc.subject | Factogaphic retrieval | en_EN |
dc.subject | Intelligent systems | en_EN |
dc.subject | Facts extraction | en_EN |
dc.subject | Automated ontology filling | en_EN |
dc.title | Технология автоматизированного наполнения онтологии фактографической поисковой системы | ru_RU |
dc.title.alternative | Technology of automated factographic retrieval system’s ontology filling | en_EN |
dc.type | Article | ru_RU |
dc.description.reference | 1. Барахнин В. Б., Федотов А. М. Построение модели фактографического поиска // Вестн. Новосиб. гос. ун-та. Серия: Информационные технологии. 2013. Т. 11, вып. 4. С. 16–27. 2. Wittgenstein L. Logisch-Philosophische Abhandlung // Annalen der Naturphilosophie. Leip-zig: Verlag Unesma, 1921. Vol. 14. Parts 3/4. P. 185–262. 3. Chen P. P. The entity-relational model. Toward a unified view of data // ACM TODS. 1976. № 1. P. 9–36. 4. Барахнин В. Б., Федотов А. М. Уточнение терминологии, используемой при описании интеллектуальных информационных систем, на основе семиотического подхода // Изв. вузов. Проблемы полиграфии и издательского дела. 2008. № 6. С. 73–81. 5. Михайлов А. И., Черный А. И., Гиляревский Р. С. Основы информатики. М.: Наука, 1968. 6. Добров Б. В., Лукашевич Н. В., Синицын М. Н., Шапкин В. Н. Разработка лингвистиче-ской онтологии по естественным наукам для решения задач информационного поиска // Тр. VII Всерос. науч. конф. «Электронные библиотеки: перспективные методы и технологии, электронные коллекции» (RCDL'2005). Ярославль, 2005. С. 70–79. 7. Welty C., McGuinness D., Uschold M., Gruninger M., Lehmann F. Ontologies: Expert Sys-tems all over again // AAAI-1999 Invited Panel Presentation. 1999. 8. Нариньяни А. С. Кентавр по имени ТЕОН: Тезаурус + Онтология // Тр. междунар. се-минара «Диалог'2001» по компьютерной лингвистике и ее приложениям. Аксаково, 2001. Т. 1. C. 184–188. 9. Хайкин С. Нейронные сети. Полный курс. 2-е изд., испр.: Пер. с англ. М.: ООО «И. Д. Вильямс», 2006. 10. Bellaachia A., Al-Dhelaan M. HG-RANK: A Hypergraph-based Keyphrase Extraction for Short Documents in Dynamic Genre. // Making Sense of Microposts (# Microposts2014). http://ceur-ws.org/Vol-1141/paper_06.pdf | ru_RU |
dc.description.reference | 1. Barakhnin V. B., Fedotov A. M. A model of factographic retrieval // Vestnik NSU: Infor-mation Technologies 2013. Vol. 11. N 4. P. 16–27. ISSN 1818-7900. (in Russian) 2. Wittgenstein L. Logisch-Philosophische Abhandlung // Annalen der Naturphilosophie. Vol. XIV. Parts 3/4. Leipzig: Verlag Unesma, 1921. P. 185–262. 3. Chen P. P. The entity-relational model. Toward a unified view of data // ACM TODS. 1976. № 1. P. 9–36. 4. Barakhnin V. B., Fedotov A. M. Clarification of the Terminology Used in the Description of Intellectual Information Systems, Based on the Semiotic Approach // Izvestiya VUZ: Problems of printing and publishing. 2008. № 6. P. 73–81. 5. Mikhailov A. I., Chernyi A. I., Gilyarevskyi R. S. Fundamentals of Informatics. Moscow: Nauka, 1968. 6. Dobrov B. V., Loukachevitch N. V., Sinitsyn M. N., Shapkin V. N. Development of Linguis-tic Ontology on Natural Sciences for Information Retrieval Purposes // Proceedings of the Seventh Anniversary of All-Russian Scientific Conference «Digital Libraries: Advanced Methods and Tech-nologies, Digital Collections» (RCDL’2005). Yaroslavl, 2005. P. 70–79. 7. Welty C., McGuinness D., Uschold M., Gruninger M., Lehmann F. Ontologies: Expert Sys-tems all over again // AAAI-1999 Invited Panel Presentation. 1999. 8. Narin'yani A. S. A centaur by name of «THEON»: Thesaurus + Ontology // Proceedings of the DIALOG'2001 International Workshop. Aksakovo, 2001. Vol. 1. P. 184–188. 9. Haykin S. Neural Networks: A Comprehensive Foundation, 2nd Edition. NJ: Prentice-Hall, 1998. 10. Bellaachia A., Al-Dhelaan M. HG-RANK: A Hypergraph-based Keyphrase Extraction for Short Documents in Dynamic Genre. // Making Sense of Microposts (# Microposts2014 http://ceur-ws.org/Vol-1141/paper_06.pdf | en_EN |
dc.subject.udc | 004.8 | |
dc.relation.ispartofvolume | 13 | |
dc.relation.ispartofnumber | 4 | |
dc.relation.ispartofpages | 5-13 |