Preview

Заводская лаборатория. Диагностика материалов

Расширенный поиск
Доступ открыт Открытый доступ  Доступ закрыт Только для подписчиков

Системы поддержки научной деятельности на основе построения профиля пользователя

https://doi.org/10.26896/1028-6861-2025-91-9-81-90

Аннотация

Приведен обзор современных систем поддержки научной деятельности (СПНД), позволяющих повысить эффективность работы специалистов-предметников и удовлетворить их информационную потребность в тематических публикациях. Особое внимание уделено применению СПНД в быстро меняющихся предметных областях, в частности — Компьютерных науках (Computer Science). Изложены основные подходы к созданию СПНД, отмечено, что ключевым направлением их развития является персонализация поиска и анализа информации. Один из основных способов реализации персонального подхода в СПНД состоит в построении профиля пользователя (ПП). Для этого используют различные технологии. В данной работе показаны преимущества конструирования ПП на основе ключевых слов (КС) — униграмм, биграмм, триграмм и n-грамм. Это позволяет создавать достоверный «информационный портрет» текста, получать для него сжатое смысловое ядро. Ключевые слова наиболее эффективно описывают короткие документы и хорошо подходят для анализа библиографических описаний научных статей, которые включают название, аннотацию и другие вспомогательные разделы. Представлена формальная постановка задачи извлечения КС из научных документов, систематизированы методы выявления КС, обоснован выбор нейросетевой модели KeyBERT для практического использования в СПНД. Отмечены высокая универсальность модели KeyBERT, ее эффективность для выявления КС в коротких научных текстах. Приведен алгоритм, реализующий KeyBERT (векторы-эмбеддинги строят на основе модели RoBERTa). Для демонстрации возможностей разработанной СПНД (в частности — построения и уточнения ПП) проведены исследования на выборке УИТ-2024, сформированной на кафедре Управления и интеллектуальных технологий МЭИ и включающей 10 тыс. документов по десяти тематикам в области Computer Science. По этой выборке алгоритм KeyBERT автоматически формирует расширенный список однословных и многословных дескрипторов, позволяющих специалисту-предметнику формировать и уточнять свой профиль, повышая релевантость рекомендаций в СПНД. Возможности предлагаемого подхода подробно рассмотрены на примерах.

Об авторах

Н. А. Назаров
Национальный исследовательский университет «МЭИ»
Россия

Николай Алексеевич Назаров

111250, Москва, Красноказарменная ул., д. 14



В. О. Толчеев
Национальный исследовательский университет «МЭИ»
Россия

Владимир Олегович Толчеев

111250, Москва, Красноказарменная ул., д. 14



Список литературы

1. Камшилова О. Н. Малые формы научного текста: ключевые слова и аннотация (информационный аспект) / Известия Российского государственного педагогического университета им. А. И. Герцена. 2013. № 156. С. 106 – 117.

2. Шереметьева С. О. Методы и модели автоматического извлечения ключевых слов / Вестник Южно-Уральского государственного университета. 2015. Т. 12. № 1. С. 76 – 81.

3. Наукометрия и экспертиза в управлении наукой / Под ред. Д. А. Новикова, А. И. Орлова, П. Ю. Чеботарева: Сб. трудов. Специальный выпуск 44. — М.: ИПУ РАН, 2013. — 568 с.

4. Орлов А. И. Современные проблемы науковедения и наукометрии / Biocosmology — neo-Aristotelism. 2017. Т. 7. № 3 – 4. С. 389 – 410.

5. Искусственный интеллект: Справочник в трех томах. Т. 2. Модели и методы / Под ред. В. Н. Захарова, Э. В. Попова, Д. А. Поспелова, В. Ф. Хорошевского. — М.: Радио и связь, 1990. — 304 с.

6. Солтон Дж. Динамические библиотечно-информационные системы. — М.: Мир, 1979. — 560 с.

7. Bollacker K. D., Lawrence S., Giles C. L. CiteSeer: an autonomous web agent for automatic retrieval and identification of interesting publications / Proceedings of the 2nd International conference on Autonomous agents. 1998. P. 116 – 123.

8. Cross J. MEDLINE, PubMed, PubMed Central, and the NLM / Editors’ Bulletin. 2006. No. 2. DOI: 10.1080/17521740701702115

9. Gündogan E., Kaya M. A novel hybrid paper recommendation system using deep learning / Scientometrics. 2022. Vol. 127. No. 7. P. 3837 – 3855. DOI: 10.1007/s11192-022-04420-8

10. Bai X., Wang M., Lee I., et al. Scientific paper recommendation: a survey / IEEE Access. 2019. Vol. 7. P. 9324 – 9339.

11. Li Z., Zou X. A review on personalized academic paper recommendation / Computer and Information Science. 2019. Vol. 12. No. 1. P. 33 – 43.

12. Kreutz C., Schenkel R. Scientific Paper Recommendation Systems: a Literature Review of recent Publications. 2022. ArXiv: 2201.00682

13. Beel J., Gipp B., Langer S., et al. Introducing Mr. DLib, a Machine-readable Digital Library / Proceedings of the ACM/IEEE Joint Conference on Digital Libraries. 2011. DOI: 10.1145/1998076.1998187

14. Bogers T., Van den Bosch A. Recommending scientific articles using CiteUlike / Proc. ACM Conf. Recommender Syst. 2008. P. 287 – 290.

15. Gingstad K., Jekteberg Y., Balog K. ArXivDigest: A Living Lab for Personalized Scientific Literature Recommendation. 2020. ArXiv: 2009.11576.

16. Beel J., Gipp B., Langer S., Breitinger C. Research-paper recommender systems: a literature survey / International Journal on Digital Libraries. 2015. P. 1 – 34.

17. Fee H., Barth J., Gremm J., et al. Coverage of academic citation databases compared with coverage of scientific social media: Personal publication lists as calibration parameters / Online Information Review. 2015. Vol. 39. P. 255 – 264. DOI: 10.1108/oir-07-2014-0159

18. Gollapalli S. D., Caragea C. Extracting keyphrases from research papers using citation networks / AAAI’14: Proceedings of the Twenty-Eighth AAAI Conference on Artificial Intelligence. 2014. Vol. 28. No. 1. P. 1629 – 1635.

19. Чжан Ч., Афанасьев Г. И. Основные технологии и перспективы эволюции персонализированных рекомендательных систем / E-Scio. 2022. No. 4(67). С. 309 – 320.

20. Жарова М. А., Цурков В. И. Нейросетевые подходы для рекомендательных систем / Изв. РАН. Теория и системы управления. 2023. № 6. С. 150 – 165. DOI: 10.31857/s0002338823060124

21. Liu Y., Ott M., Goyal N., et al. RoBERTa: A robustly optimized BERT pretraining approach. 2019. ArXiv: 1907.11692.

22. Papagiannopoulou E., Tsoumakas G. A review of keyphrase extraction / Wiley Interdisciplinary Reviews — Data Mining and Knowledge Discovery. 2020. Vol. 10. No. 2. DOI: 10.1002/widm.1339

23. Kulkarni M., Mahata D., Arora R., Bhowmik R. Learning Rich Representation of Keyphrases from Text / Findings of the Association for Computational Linguistics. 2022. P. 891 – 906. DOI: 10.18653/v1/2022.findings-naacl.67

24. Liang X., Wu S., Li M., Li Z. Unsupervised keyphrase extraction by jointly modeling local and global context / Proceedings of the Conference on Empirical Methods in Natural Language Processing. 2021. P. 155 – 164. DOI: 10.18653/v1/2021.emnlp-main.14

25. Grootendorst M. KeyBERT: Minimal Keyword Extraction with BERT. 2020. DOI: 10.5281/zenodo.4461265

26. Козлов П. А., Назаров Н. А., Толчеев В. О. Персонализированная система поддержки научной деятельности в малых исследовательских коллективах / Сборник материалов XXVII Международной научно-технической конференции «Информационные системы и технологии», Нижегородский государственный технический университет им. Р. Е. Алексеева. 2021. С. 630 – 635.

27. Козлов П. А., Мохов А. С., Назаров Н. А. и др. Сравнительный анализ бинарных классификаторов на массиве научных публикаций / Заводская лаборатория. Диагностика материалов. 2022. Т. 88. № 7. С. 79 – 87. DOI: 10.26896/1028-6861-2022-88-7-79-87


Рецензия

Для цитирования:


Назаров Н.А., Толчеев В.О. Системы поддержки научной деятельности на основе построения профиля пользователя. Заводская лаборатория. Диагностика материалов. 2025;91(9):81-90. https://doi.org/10.26896/1028-6861-2025-91-9-81-90

For citation:


Nazarov N.A., Tolcheev V.O. Scientific support systems based on the constructing user profile. Industrial laboratory. Diagnostics of materials. 2025;91(9):81-90. (In Russ.) https://doi.org/10.26896/1028-6861-2025-91-9-81-90

Просмотров: 9


ISSN 1028-6861 (Print)
ISSN 2588-0187 (Online)