Preview

Заводская лаборатория. Диагностика материалов

Расширенный поиск

Разработка новых модификаций профильных методов классификации и построение коллективов решающих правил

Аннотация

Рассмотрена задача повышения точности классификации двуязычных (русско-английских) текстовых документов. На основе известных профильных методов разработаны новые модификации, которые используются для формирования коллективов решающих правил (КРП). Исследовано влияние точности и разнородности членов КРП на качество классификации. Результаты экспериментов на сформированных двуязычных выборках показали, что применение КРП позволяет снизить ошибку классификации.

Об авторах

А. С. Мохов
Национальный исследовательский университет «МЭИ»
Россия


В. О. Толчеев
Национальный исследовательский университет «МЭИ»
Россия


Список литературы

1. Растригин Л. А., Эренштейн Р. Х. Метод коллективного распознавания. - М.: Энергоиздат, 1981. - 79 с.

2. Абусев Р. А., Лумельский Я. П. Статистическая групповая классификация: Учебное пособие. - Пермь: ПГУ, 1987. - 92 с.

3. Ruta D., Gabrys B. A Theoretical Analysis of the Limits of Majority Voting Errors for Multiple Classifier Systems / Pattern Analysis and Applications. 2002. N 5. P. 333 - 350.

4. Толчеев В. О. Синтез коллективов решающих правил для проведения классификации текстовых документов / Информационные технологии. 2007. № 10. С. 32 - 38.

5. Yang Y., Liu X. A Re-Examination of Text Categorization Methods. Proceedings of the 22nd Annual International ACM SIGIR Conference on Research and Development in Information Retrieval, 1999. P. 42 - 49.

6. Толчеев В. О. Модели и методы классификации текстовой информации / Информационные технологии. 2004. № 5. С. 6 - 14.

7. Сэлтон Г. Автоматическая обработка, хранение и поиск информации. - М.: Советское радио, 1973. - 560 с.

8. Aas K., Eikvil L. Text Categorization: A Survey. - Oslo: Norwegian Computing Center, 1999. P. 1 - 37.

9. Мохов А. С., Толчеев В. О. Разработка методов высокоточной классификации двуязычных текстовых библиографических документов / Информационные технологии. 2014. № 5. С. 8 - 13.

10. Толчеев В. О. Основы теории классификации многомерных наблюдений. Учебное пособие. - М.: МЭИ, 2012. - 121 с.

11. Мохов А. С., Толчеев В. О. Разработка профильных методов классификации двуязычных текстовых документов. Материалы 6-й Всероссийской мультиконференции по проблемам управления - МКПУ-2013. - Дивноморское, 2013. Т. 1. С. 75 - 79.

12. Kuncheva L. I., Whitaker C. J. Measures of Diversity in Classifiers Ensembles and Their Relationship with the Ensemble Accuracy / Machine Learning. 2003. N 51. P. 181 - 207.

13. Орлов А. И., Толчеев В. О. Об использовании непараметрических статистических критериев для оценки точности классификации / Заводская лаборатория. Диагностика материалов. 2011. Т. 77. № 3. С. 58 - 66.


Рецензия

Для цитирования:


Мохов А.С., Толчеев В.О. Разработка новых модификаций профильных методов классификации и построение коллективов решающих правил. Заводская лаборатория. Диагностика материалов. 2015;81(3):70-75.

For citation:


Mokhov A.S., Tolcheev V.O. Development of New Modifications of Profile Classification Methods for Bilingual Text Documents and Ensemble of Classifiers Synthesis. Industrial laboratory. Diagnostics of materials. 2015;81(3):70-75. (In Russ.)

Просмотров: 357


ISSN 1028-6861 (Print)
ISSN 2588-0187 (Online)