Preview

Industrial laboratory. Diagnostics of materials

Advanced search

Development of New Modifications of Profile Classification Methods for Bilingual Text Documents and Ensemble of Classifiers Synthesis

Abstract

We consider a problem of increasing the correctness of classifying bilingual (Russian-English) text documents. Proceeding from the known profile methods we develop new modifications and construct different ensembles of classifiers (EoC). Several EoCs which consist of different profile methods, are built. The diversity and fidelity of EoC’s members are investigated. As a result, we get better accuracy with EoCs than that with a single classifier.

About the Authors

A. S. Mokhov
Национальный исследовательский университет «МЭИ»
Russian Federation


V. O. Tolcheev
Национальный исследовательский университет «МЭИ»
Russian Federation


References

1. Растригин Л. А., Эренштейн Р. Х. Метод коллективного распознавания. - М.: Энергоиздат, 1981. - 79 с.

2. Абусев Р. А., Лумельский Я. П. Статистическая групповая классификация: Учебное пособие. - Пермь: ПГУ, 1987. - 92 с.

3. Ruta D., Gabrys B. A Theoretical Analysis of the Limits of Majority Voting Errors for Multiple Classifier Systems / Pattern Analysis and Applications. 2002. N 5. P. 333 - 350.

4. Толчеев В. О. Синтез коллективов решающих правил для проведения классификации текстовых документов / Информационные технологии. 2007. № 10. С. 32 - 38.

5. Yang Y., Liu X. A Re-Examination of Text Categorization Methods. Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1999. P. 42 - 49.

6. Толчеев В. О. Модели и методы классификации текстовой информации / Информационные технологии. 2004. № 5. С. 6 - 14.

7. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. - М.: Советское радио, 1973. - 560 с.

8. Aas K., Eikvil L. Text Categorization: A Survey. - Oslo: Norwegian Computing Center, 1999. P. 1 - 37.

9. Мохов А. С., Толчеев В. О. Разработка методов высокоточной классификации двуязычных текстовых библиографических документов / Информационные технологии. 2014. № 5. С. 8 - 13.

10. Толчеев В. О. Основы теории классификации многомерных наблюдений. Учебное пособие. - М.: МЭИ, 2012. - 121 с.

11. Мохов А. С., Толчеев В. О. Разработка профильных методов классификации двуязычных текстовых документов. Материалы 6-й Всероссийской мультиконференции по проблемам управления - МКПУ-2013. - Дивноморское, 2013. Т. 1. С. 75 - 79.

12. Kuncheva L. I., Whitaker C. J. Measures of Diversity in Classifiers Ensembles and Their Relationship with the Ensemble Accuracy / Machine Learning. 2003. N 51. P. 181 - 207.

13. Орлов А. И., Толчеев В. О. Об использовании непараметрических статистических критериев для оценки точности классификации / Заводская лаборатория. Диагностика материалов. 2011. Т. 77. № 3. С. 58 - 66.


Review

For citations:


Mokhov A.S., Tolcheev V.O. Development of New Modifications of Profile Classification Methods for Bilingual Text Documents and Ensemble of Classifiers Synthesis. Industrial laboratory. Diagnostics of materials. 2015;81(3):70-75. (In Russ.)

Views: 355


ISSN 1028-6861 (Print)
ISSN 2588-0187 (Online)