Preview

Industrial laboratory. Diagnostics of materials

Advanced search

Automated Estimation of the Wording of Scientific Novelty of Publications

Abstract

A possibility of using Text Mining methods for the tasks previously solved by expert procedures is demonstrated. We consider the issues attributed to determination of the scientific novelty of publications and identification of originating technological trends using Text Mining. We also consider the specificity of the problems and their possible solutions, formulate the problem and review the methods used in literature. Methods of automated detection of words-markers which characterize the scientific novelty and their use in creation of specialized templates are studied. The samples containing documents which underwent expert estimations are formed and described to develop the technique of template construction. The results of practical use of the templates thus obtained on the base of analysis of the publications in the field of Computer Science are discussed.

About the Author

V. O. Tolcheev
Национальный исследовательский университет «МЭИ»
Russian Federation


References

1. Маннинг К. Д., Рагхаван П., Шютце X. Введение в информационный поиск. -М.: Вильямс, 2014. - 528 с.

2. Большакова Е. И., КлышинскиЗ Э. С., Ландэ Д. В. и др. Автоматическая обработка текстов на естественном языке и компьютерная лингвистика. -М.: МИЭМ, 2011. - 272 с.

3. Кузнецова Ю. М., Осипов Г. С., Чудова Н. В., Швец А. В. Автоматическое установление соответствия статей требованиям к научным публикациям / Труды ИСА РАН. 2012. Т. 62. № 3. С. 132 - 138.

4. Орлов А. И. Критерии выбора показателей эффективности научной деятельности / Контроллинг. 2013. № 3(49). С. 72 - 78.

5. Герасимов С. В., Курынин Р. В., Машечкин И. В., Петровский М. И., Царёв Д. В., Шестимеров А. А. Инструментальные средства оценки качества научно-технических документов / Труды ИСА РАН. 2013. Т. 24. С. 359 - 379.

6. Yoon J. Detecting weak signals for long-term business opportunities using text mining of Web news / Expert Systems with Applications. 2012. Vol. 39. P. 12543 - 12550.

7. Микова H., Соколова А. Мониторинг глобальных технологических трендов: теоретические основы и лучшие практики / Форсайт. 2014. Т. 8. №4. С. 64-83.

8. Орлов А. И. Экспертные оценки / Заводская лаборатория. Диагностика материалов. 1996. Т. 62. № 1. С. 54 - 60.

9. Леонова Ю. В., Федотов А. М. Извлечение знаний и фактов из текстов диссертаций и авторефератов для изучения связей научных сообществ / XV Всероссийская научная конференция RCDL. - Ярославль: ЯрГУ, 2013. С. 135 - 144.

10. Большакова Е. И., Васильева Н. Э., Морозов С. С. Лексикосинтаксические шаблоны для автоматического анализа научно-технических текстов / X Национальная конференция по искусственному интеллекту. Т. 2. - М.: Физматлит, 2006. С. 506 - 524.

11. Дербенёв Н. В., Толчеев В. О. Что можно улучшить в наукометрическом анализе - учет наличия дубликатов и заимствований в научных публикациях / Управление большими системами. 2013. №44. С. 366-380.

12. Новиков Д. А., Орлов А. И. Математические методы классификации / Заводская лаборатория. Диагностика материалов. 2012. Т. 78. №4. С. 3-5.

13. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. - М.: Советское радио, 1973. - 560 с.

14. Толчеев В. О. Модели и методы классификации текстовой информации / Информационные технологии. 2004. № 5. С. 6 - 14.

15. Powers D. Evaluation: From Precision, Recall and F-Factor to ROC, Informedness, Markedness and Correlation / J. Machine Learning Technol. 2011. Vol. 2(1). P. 37-63.

16. Liakata M., Thompson P., de Waard A., Nawaz R., Maat H. P., Ananiadou S. A Three-Way Perspective on Scientific Discourse Annotation for Knowledge Extraction / Proc. Workshop DSSD. 2012. P. 37 - 46.

17. Барахнин В. Б., Ткачев Д. А. Классификация математических документов с использованием составных ключевых терминов / Материалы Всероссийской конференции «ЗОНТ». - Новосибирск, 2009. С. 16-23.

18. Швец А. В. Экспериментальный метод автоматического определения уровня качества научных публикаций / Труды пятой международной конференции «Системный анализ и информационные технологии». Красноярск, 2013. Т. 1. С. 304 - 312.

19. Валеева Н. Г. Жанрово-стилистическая характеристика научных текстов. Введение в переводоведение. - М.: РУДН, 2006. - 85 с.

20. Ярская В. Н. Методология диссертационного исследования: Методическое пособие. -Саратов: ПМУЦ, 2002. - 189 с.


Review

For citations:


Tolcheev V.O. Automated Estimation of the Wording of Scientific Novelty of Publications. Industrial laboratory. Diagnostics of materials. 2017;83(5):72-78. (In Russ.)

Views: 309


ISSN 1028-6861 (Print)
ISSN 2588-0187 (Online)