ВЕБ-СЕРВИСЫ ДЛЯ ПРЕДСКАЗАНИЯ МИШЕНЕЙ МИКРОРНК С ПОМОЩЬЮ НЕЙРОННЫХ СЕТЕЙ
Аннотация и ключевые слова
Аннотация (русский):
Поиск генов мишеней микроРНК требует разработки новых программных средств и веб-сервисов. МикроРНК – короткие некодирующие молекулы РНК – играют важную роль в регуляции метаболизма, в ответе на стрессовые воздействия окружающей среды у растений, регулируют экспрессию генов. Понимание функций микроРНК, исследование их генов-мишеней, может помочь в разработке новых лекарственных препаратов, решении биотехнологических задач. Исследование и определение мишеней микроРНК в геноме связано с техническими проблемами. МикроРНК способствует деградации мРНК или подавляет ее трансляцию, и этот процесс может происходить без полной комплементарности мишени. Таким образом определение мишени по принципу комплементарности не однозначно. Кроме того, одна молекула микроРНК может соответствовать сразу нескольким генам-мишеням. Решением является использование больших объемов данных и методов машинного обучения, нейронных сетей. Нейросети в биоинформатике используются для различных задач, таких как анализ биомедицинских данных, диагностика, прогнозирование, классификация и сегментация нуклеотидных последовательностей. Поиск и предсказание мишеней микроРНК с помощью методов машинного обучения активно развивается в настоящее время. Был проведен сравнительный анализ современных нейронных сетей для данной задачи. Разработан веб-сервис для предсказания микроРНК с использованием нейронной сети. С помощью языка программирования Python и библиотеки Flask была разработана серверная часть сервиса. Использовалась нейронная сеть Mitar, основанная на глубоком обучении, которая способна предсказывать мишени для микроРНК с более высокой точностью. Будут продолжены исследования с целью повышения эффективности и расширения функционала разработанной программной системы.

Ключевые слова:
биоинформатика, микроРНК, гены-мишени, предсказание, нейронные сети, медицинская информатики, веб-сервис
Список литературы

1. Chao H., Zhang S., Hu Y., Ni Q., Xin S., Zhao L., Ivanisenko V.A., Orlov Y.L., Chen M. Integrating omics databases for enhanced crop breeding. J. Integr Bioinform., 2023, p. 20230012, doi:https://doi.org/10.1515/jib-2023-0012.

2. Quillet A., Saad C., Ferry G., Anouar Y., Vergne N., Lecroq T., Dubessy C. Improving Bioinformatics Prediction of microRNA Targets by Ranks Aggregation. Front. Genet., 2020, vol. 10, p. 1330, doi:https://doi.org/10.3389/fgene.2019.01330.

3. Roberts J.T., Borchert G.M. Computational Prediction of MicroRNA Target Genes, Target Prediction Databases, and Web Resources. Bioinformatics in MicroRNA Research. Methods in Molecular Biology, NY: Springer, 2017, pp. 109-122, doi:https://doi.org/10.1007/978-1-4939-7046-9_8.

4. Orlov Y.L., Babenko V.N., Dergilev A.V., Galieva A.G., Dobrovolskaya O.B., Chen M. Databases and computer resources on plant mirna to study its role in abiotic stress response. In book: Plant Genetics, Genomics, Bioinformatics, and Biotechnology (PlantGen2019) Abstracts. Institute of Cytology and Genetics, Siberian Branch of the Russian Academy of Sciences, 2019, p. 150, doi:https://doi.org/10.18699/PlantGen2019-132.

5. Orlov Y.L., Dobrovolskaya O., Yuan C.H., Afonnikov D.A., Zhu Y., Chen M. Integrative computer analysis of antisense transcripts and miRNA targets in plant genomes. Journal of Stress Physiology & Biochemistry, 2012, vol. 8, no. 3, p. S7.

6. Орлов Ю.Л., Цуканов А.В., Богомолов А.Г., Добровольская О.Б. Методы биоинформатики для поиска некодирующих РНК, связанных с устойчивостью растений к засухе. Сборник тезисов республиканской научной конференции современные проблемы генетики, геномики и биотехнологии. Академия Наук Республики Узбекистан, Центр Геномики и Биоинформатики. 18 мая 2018 года. Ташкент, 2018, с. 139-142.

7. Wang J., Meng X., Dobrovolskaya O.B., Orlov Y.L., Chen M. Non-coding RNAs and Their Roles in Stress Response in Plants. Genomics Proteomics Bioinformatics, 2017, vol. 15, no. 5, pp. 301-312, doi:https://doi.org/10.1016/j.gpb.2017.01.007.

8. Voropaeva E.N., Pospelova T.I., Orlov Y.L., Churkina M.I., Berezina O.V., Gurazheva A.A., Ageeva T.A., Seregina O.B., Maksimov V.N. The Methylation of the p53 Targets the Genes MIR-203, MIR-129-2, MIR-34A and MIR-34B/C in the Tumor Tissue of Diffuse Large B-Cell Lymphoma. Genes, 2022, vol. 13, no. 8, pp. 1401, doi:https://doi.org/10.3390/genes13081401.

9. Bartel D.P. MicroRNAs: genomics, biogenesis, mechanism, and function. Cell, 2004, vol. 116, no. 2, pp. 281-297, doi:https://doi.org/10.1016/s0092-8674(04)00045-5.

10. Klimontov V.V., Koshechkin K.A., Orlova N.G., Sekacheva M.I., Orlov Y.L. Medical Genetics, Genomics and Bioinformatics-2022. International Journal of Molecular Sciences, 2023, vol. 24, no. 10, p. 8968, doi:https://doi.org/10.3390/ijms24108968.

11. Matsuyama H., Suzuki H.I. Systems and Synthetic microRNA Biology: From Biogenesis to Disease Pathogenesis. International Journal of Molecular Sciences, 2019, vol. 21, pp. 132, doi:https://doi.org/10.3390/ijms21010132.

12. Anashkina A.A., Leberfarb E.Y., Orlov Y.L. Recent Trends in Cancer Genomics and Bioinformatics Tools Development. Int. J. Mol. Sci., 2021, 22, p. 12146, doi:https://doi.org/10.3390/ijms222212146.

13. Riffo-Campos L., Riquelme I., Brebi-Mieville P. Tools for Sequence- Based miRNA Target Prediction: What to Choose? International Journal of Molecular Sciences, 2016, vol. 17, no. 12, p. 1987, doi:https://doi.org/10.3390/ijms17121987.

14. Putta P., Orlov Y.L., Podkolodnyy N.L., Mitra C.K. Relatively conserved common short sequences in transcription factor binding sites and miRNA. Vavilov Journal of Genetics and Breeding, 2011, vol. 15, no. 4, pp. 750-756.

15. Schmidhuber J. Deep Learning. Scholarpedia, 2015, vol. 10, no. 11, p. 32832, doi:https://doi.org/10.4249/scholarpedia.32832.

16. Berg M.M.J. van den, Krauskopf J., Ramaekers J.G., Kleinjans J.C.S., Prickaerts J., Bried J.J. Circulating microRNAs as potential biomarkers for psychiatric and neurodegenerative disorders. Progress in Neurobiology, 2020, vol. 185, p. 101732, doi:https://doi.org/10.1016/j.pneurobio.2019.101732.

17. Vasu S., Kumano K., Darden C.M., Rahman I., Lawrence M.C., Naziruddin B. MicroRNA Signatures as Future Biomarkers for Diagnosis of Diabetes States. Cells, 2019, vol. 8, no. 12, p. 1533, doi:https://doi.org/10.3390/cells8121533.

18. Yuan Y., Weidhaas J.B. Functional microRNA binding site variants. Molecular Oncology, 2019, vol. 13, no. 1, pp. 4-8, doi:https://doi.org/10.1002/1878-0261.12421.

19. Orlov Y.L., Potapov V.N. Complexity: an internet resource for analysis of DNA sequence complexity. Nucleic Acids Res., 2004, iss. 32, pp. 628-33, doi:https://doi.org/10.1093/nar/gkh466.

20. Витяев Е.Е., Орлов Ю.Л., Вишневский О.В., Беленок А.С., Колчанов Н.А. Компьютерная система "GENE DISCOVERY" для поиска закономерностей организации регуляторных последовательностей эукариот. Молекулярная биология, 2001, т. 35, № 6, с. 952-960.

21. Vityaev E.E., Orlov Y.L., Vishnevsky O.V., Pozdnyakov M.A., Kolchanov N.A. Computer system "Gene Discovery" for promoter structure analysis. In Silico Biol., 2002, vol. 2, pp. 257-62.

22. Orlov Y.L., Filippov V.P., Potapov V.N., Kolchanov N.A. Construction of stochastic context trees for genetic texts. In Silico Biol., 2002, vol. 2, no. 3, pp. 233-247.

23. Orlov Y.L., Boekhorst R., Abnizova I.I. Statistical measures of the structure of genomic sequences: entropy, complexity, and position information. J Bioinform Comput Biol., 2006, vol. 4, pp. 523-536, doi:https://doi.org/10.1142/s0219720006001801.

24. Митина А.В., Орлов Ю.Л. Оценка лингвистической сложности генетических последовательностей штаммов SARS-CoV-2. Сборник научных трудов VII Съезда Биофизиков России: в 2 томах, том 1 – Краснодар: Типография ФГБОУ ВО «КубГТУ», 2023, с. 330, doi:https://doi.org/10.26297/SbR6.2023.001.

25. Дергилев А.И., Орлова Н.Г., Митина А.В., Орлов Ю.Л. Применение методов оценки сложности текста к анализу геномных кластеров сайтов связывания транскрипционных факторов. Сборник научных трудов VII Съезда Биофизиков России: в 2 томах, том 1 - Краснодар: Типография ФГБОУ ВО «КубГТУ», 2023, с. 335-336, doi:https://doi.org/10.26297/SbR6.2023.001.

26. Gorbenko I.V., Petrushin I.S., Shcherban A.B., Orlov Y.L., Konstantinov Y.M. Short Interrupted Repeat Cassette (SIRC)-Novel Type of Repetitive DNA Element Found in Arabidopsis thaliana. Int J Mol Sci., 2023, vol. 24, no. 13, p. 11116, doi:https://doi.org/10.3390/ijms241311116.

27. Voropaeva E.N., Pospelova T.I., Voevoda M.I., Maksimov V.N., Orlov Y.L., Seregina O.B. Clinical aspects of TP53 gene inactivation in diffuse large B-cell lymphoma. BMC Med Genomics, 2019, vol. 12, suppl. 2, p. 35, doi:https://doi.org/10.1186/s12920-019-0484-9.

28. Babenko V.N., Bragin A.O., Spitsina A.M., Chadaeva I.V., Galieva E.R., Orlova G.V., Medvedeva I.V., Orlov Y.L. Analysis of differential gene expression by RNA-seq data in brain areas of laboratory animals. J Integr Bioinform., 2016, vol.13, no. 4, p. 292, doi:https://doi.org/10.2390/biecoll-jib-2016-292.

29. Orlov Y.L., Baranova A.V. Editorial: Bioinformatics of Genome Regulation and Systems Biology. Front Genet., 2020, vol. 11, pp. 625, doi:https://doi.org/10.3389/fgene.2020.00625.

30. Orlov Y., Dobrovolskaya O., Chen M., Hofestaedt R. Bioinformatics of genome regulation and structure – 2020 papers collection. Journal of Integrative Bioinformatics, 2020 vol. 17, no. 4, p. 20200038, doi:https://doi.org/10.1515/jib-2020-0038.

31. Спицина А.М., Орлов Ю.Л., Подколодная Н.Н., Свичкарев А.В., Дергилев А.И., Чен М., Кучин Н.В., Черных И.Г., Глинский Б.М. Суперкомпьютерный анализ геномных и транскриптомных данных, полученных с помощью технологий высокопроизводительного секвенирования ДНК. Программные системы: теория и приложения, 2015, т. 6, № 1(24), c. 157-174, doi:https://doi.org/10.25209/2079-3316-2015-6-1-157-174.

32. Orlov Y.L., Bragin A.O., Babenko R.O., Dresvyannikova A.E., Kovalev S.S., Shaderkin I.A., Orlova N.G., Naumenko F.M. Integrated Computer Analysis of Genomic Sequencing Data Based on ICGenomics Tool. In: Advances in Intelligent Systems, Computer Science and Digital Economics. CSDEIS 2019, AISC 1127. International Journal of Intelligent Systems and Applications (IJISA), 2020, pp. 154-164, doi:https://doi.org/10.1007/978-3-030-39216-1_15.

33. Орлов Ю.Л., Брагин А.О. и др. ICGenomics: программный комплекс анализа символьных последовательностей геномики. Вавиловский журнал генетики и селекции, 2012, т. 16, № 4/1, с. 732-741 .

34. Veljkovic A.N., Orlov Y.L., Mitic N.S. BioGraph: Data Model for Linking and Querying Diverse Biological Metadata. International Journal of Molecular Sciences, 2023, vol. 24, no. 8, pp. 6954, doi:https://doi.org/10.3390/ijms24086954.


Войти или Создать
* Забыли пароль?