Алгоритм сочетания хромато-масс-спектрометрического ненаправленного профилирования и многомерного анализа для выявления веществ-маркеров в образцах сложного состава
https://doi.org/10.26896/1028-6861-2020-86-7-12-19
Аннотация
Лавинообразное развитие методов статистической обработки данных, вычислительных мощностей, техники хромато-масс-спектрометрического анализа и омиксных технологий в последние десятилетия так и не привело к созданию унифицированного протокола для ненаправленного профилирования. Влияние систематических ошибок снижает воспроизводимость и достоверность результатов исследования, одновременно затрудняя объединение и анализ данных масштабных многодневных хромато-масс-спектрометрических экспериментов. В работе предложен алгоритм проведения омиксного профилирования для выявления потенциальных веществ-маркеров в образцах сложного состава на примере анализа образцов мочи разных клинических групп пациентов. Профилирование проведено методом жидкостной хромато-масс-спектрометрии. Выбор маркеров проводили методами многомерного анализа, в том числе машинного обучения и отбора переменных. Тестирование подхода выполняли с использованием независимого набора данных алгоритмами кластеризации и проецирования на главные компоненты.
Ключевые слова
Об авторах
И. В. ПлющенкоРоссия
Иван Викторович Плющенко
119991, Москва, ГСП-1, Ленинские горы, 1, стр. 3
Д. Г. Шахматов
Россия
Дмитрий Геннадьевич Шахматов
123423, Москва, ул. Саляма Адиля, 2
И. А. Родин
Россия
Игорь Александрович Родин
119991, Москва, ГСП-1, Ленинские горы, 1, стр. 3
Список литературы
1. Arivaradarajan P., Misra G. (Eds.). Omics approaches, technologies and applications: integrative approaches for understanding OMICS data. 1st edition. — Singapore: Springer Nature, 2018. P. 158. DOI: 10.1007/978-981-13-2925-8_4.
2. Gorrochategui E., Jaumot J., Lacorte S., Tauler R. Data analysis strategies for targeted and untargeted LC-MS metabolomic studies: overview and workflow / TrAC. 2016. Vol. 82. P. 425 – 442. DOI: 10.1016/j.trac.2016.07.004.
3. Argueso C. T., Assmann S. M., Birnbaum K. D., et al. Directions for research and training in plant omics: Big Questions and Big Data / Plant direct. 2019. Vol. 3. N 4. P. e00133. DOI: 10.1002/pld3.133.
4. Lozano D. C. P., Thomas M. J., Jones H. E., Barrow M. P. Petroleomics: Tools, Challenges, and Developments / Annu. Rev. Anal. Chem. 2020. Vol. 13. P. 20. 1 – 20. 26. DOI: 10.1146/ annurev_anchem-091619-091824.
5. Ferranti P. The future of analytical chemistry in foodomics / Curr. Opin. Food Sci. 2018. Vol. 22. P. 102 – 108. DOI: 10.1016/ j.cofs.2018.02.005.
6. Bolotnik T. A., Timchenko Y. V., Plyushchenko I. V. Use of Chemometric Methods of Data Analysis for the Identification and Typification of Petroleum and Petroleum Products / J. Anal. Chem. 2019. Vol. 74. N 13. P. 1336 – 1340. DOI: 10.1134/S1061934819130045.
7. Kharyuk P., Nazarenko D., Oseledets I., et al. Employing fingerprinting of medicinal plants by means of LC-MS and machine learning for species identification task / Sci. Rep. 2018. Vol. 8. N 1. P. 17053. DOI: 10.1038/s41598-018-35399-z.
8. Cui X., Tang J., Yang Q., et al. Assessing the effectiveness of direct data merging strategy in long-term and large-scale pharmacometabonomics / Front. Pharmacol. 2019. Vol. 10. P. 127. DOI: 10.3389/fphar.2019.00127.
9. Yang Q., Hong J., Li Y., et al. A novel bioinformatics approach to identify the consistently well-performing normalization strategy for current metabolomic studies / Brief. Bioinform. 2019. DOI: 10.1093/bib/bbz137.
10. Holman J. D., Tabb D. L., Mallick P. Employing ProteoWizard to convert raw mass spectrometry data / Curr. Protoc. Bioinformatics. 2014. Vol. 46. N 1. P. 13.24.1 – 13.24.9. DOI: 10.1002/0471250953.bi1324s46.
11. Chang H. Y., Chen C. T., Lih T. M., et al. iMet-Q: a user-friendly tool for label-free metabolomics quantitation using dynamic peak-width determination / PLOS one. 2016. Vol. 11. N 1. P. e0146112. DOI: 10.1371/journal.pone.0146112.
12. R Core Team. R: A language and environment for statistical computing. R Foundation for Statistical Computing, Vienna, Austria, 2019.
13. Kuhn M., Johnson K. Applied predictive modeling. 1st edition. — New York: Springer, 2013. — 615 p. DOI: 10.1007/ 978-1-4614-6849-3.
14. Andrews J. L., McNicholas P. D. Variable selection for clustering and classification / J. Classif. 2014. Vol. 31. N 2. P. 136 – 153. DOI: 10.1007/s00357-013-9139-2.
15. Li B., Tang J., Yang Q., et al. NOREVA: normalization and evaluation of MS-based metabolomics data / Nucleic Acids Res. 2017. Vol. 45. N W1. P. W162 – W170. DOI: 10.1093/nar/gKx449.
16. Huber W., Von Heydebreck A., Sültmann H., et al. Variance stabilization applied to microarray data calibration and to the quantification of differential expression / Bioinformatics. 2002. Vol. 18. N 1. P. S96 – S104. DOI. 10. 1093/bioinformatics/18.suppl_1.S96.
17. Karpievitch Y. V., Taverner T., Adkins J. N., et al. Normalization of peak intensities in bottom-up MS-based proteomics using singular value decomposition / Bioinformatics. 2009. Vol. 25. N 19. P. 2573 – 2580. DOI: 10.1093/bioinformatics/btp426.
18. Gautier L., Cope L., Bolstad B. M., Irizarry R. A. Affy-analysis of Affymetrix GeneChip data at the probe level / Bioinformatics. 2004. Vol. 20. N 3. P. 307 – 315. DOI: 10.1093/bioinformatics/btg405.
Рецензия
Для цитирования:
Плющенко И.В., Шахматов Д.Г., Родин И.А. Алгоритм сочетания хромато-масс-спектрометрического ненаправленного профилирования и многомерного анализа для выявления веществ-маркеров в образцах сложного состава. Заводская лаборатория. Диагностика материалов. 2020;86(7):12-19. https://doi.org/10.26896/1028-6861-2020-86-7-12-19
For citation:
Plyushchenko I.V., Shakhmatov D.G., Rodin I.A. Algorithm of combining chromatography mass spectrometry-untargeted profiling and multivariate analysis for identification of marker-substances in samples of complex composition. Industrial laboratory. Diagnostics of materials. 2020;86(7):12-19. (In Russ.) https://doi.org/10.26896/1028-6861-2020-86-7-12-19