Размер линейных молекул пептидной природы может рассматриваться как число содержащихся в них аминокислотных остатков ( р ). Целью работы был анализ области существования и встречаемости различных природных пептидных структур с различной величиной р . В работе использовались данные базы SwissProt о более чем 5,6·105 первичных структурах, определенных полностью (sequence complete). Из них нами были удалены структуры, содержащие нестандартные аминокислотные остатки, а также идентичные копии аминокислотных последовательностей. В результате для анализа использовано 463450 различных последовательностей длиной 2 до 35213 аминокислотных остатков. Анализ показал, что у разных биологических доменов и царств число встречающихся пептидных структур на шкале р характеризуются разными областями существования, а формы профилей полученных кривых близки к ряду известных распределений. В то же время у них могут наблюдаться острые высокие пики, свидетельствующие о наличии большого количества специфических белков с одинаковой величиной р . Таким образом продемонстрировано существование множества разных первичных структур белков одинаковой длины, обладающих одинаковыми функциями. Рассмотрены возможные причины особенностей полученных распределений.
пептид, белок, аминокислотная последовательность, база данных
1. Sewald N., Jakubke H.-D. Peptides: Chemistry and Biology. Weinheim, WILEY-VCH Verlag GmbH, 2002, 562 p.
2. Замятнин А.А. Особенности совокупности природных олигопептидов. Нейрохимия, 2016, т. 33, № 4, с. 265-275. DOI:https://doi.org/10.1134/S1819712416040176. @@[Zamyatnin A.A. Features of the totality of natural oligopeptides. Neurochemistry, 2016, vol. 33, no. 4, pp. 265-275. DOI: 10.1134 / S1819712416040176. (In Russ.)] ; DOI: https://doi.org/10.7868/S1027813316040178; EDN: https://elibrary.ru/ZCKCOV
3. Zamyatnin A.A. Structural-functional diversity of the natural oligopeptides. Progr. Biophys. Mol. Biol., 2018, vol. 133, pp. 1-8. DOI:https://doi.org/10.1016/j.pbiomolbio.2017.09.024. ; ; EDN: https://elibrary.ru/XXSHMD
4. Bairoch A., Boeckmann B. The SWISS-PROT protein sequence data bank. Nucleic Acids Res., 1991, vol. 19, no 1, pp. 2247-2249. DOI:https://doi.org/10.1093/nar/19.suppl.2247.
5. Kneale G.G., Kennard O. The EMBL nucleotide sequence data library. Biochem. Soc. Trans., 1984, vol. 12, no. 6, pp. 1011-1014. DOI:https://doi.org/10.1042/bst0121011.
6. Church D.M., Goodstadt L., Hillier L.W., Zody M.C., Goldstein S., She X., Bult C.J., Agarwala R., Cherry J.L., DiCuccio M., Hlavina W., Kapustin Y., Meric P., Maglott D., Birtle Z., Marques A.C., Graves T., Zhou S., Teague B., Potamousis K., Churas C., Place M., Herschleb J., Runnheim R., Forrest D., Amos-Landgraf J., Schwartz D.C., Cheng Z., Lindblad-Toh K., Eichler E.E., Ponting C.P.; Mouse Genome Sequencing Consortium. Lineage-specific biology revealed by a finished genome assembly of the mouse. PLoS Biol., 2009, vol. 7, no. 5, p. e1000112. DOI:https://doi.org/10.1371/journal.pbio.1000112.
7. Woese C.R., Kandler O., Wheelis M.L. Towards a natural system of organisms: proposal for the domains Archaea, Bacteria, and Eucarya. Proc. Natl. Acad. Sci. USA, 1990, vol. 87, no. 12, pp. 4576-4579. DOI:https://doi.org/10.1073/pnas.87.12.4576.
8. Замятнин А.А. Биофизические проблемы олигопептидной регуляции. Биофизика, 2003, т. 48, № 6, с. 1030-1039. @@[Zamyatnin A.A. Biophysical problems of oligopeptide regulation. Biophysics, 2003, vol. 48, no. 6, pp. 1030-1039. (In Russ.)] ; EDN: https://elibrary.ru/OPJFNN
9. Замятнин А.А. Биохимические проблемы олигопептидной регуляции. Биохимия, 2004, т. 69, № 11, с. 1565-1573. DOI:https://doi.org/10.1007/s10541-005-0073-8. @@[Zamyatnin A.A. Biochemical problems of oligopeptide regulation. Biochemistry, 2004, vol. 69, no. 11, pp. 1565-1573. (In Russ.)] ; EDN: https://elibrary.ru/ORCIKN
10. Ramakumar S. Stochastic dynamics modeling of the protein sequence length distribution in genomes: implications for microbial evolution. Physica A: Statistical Mechanics and its Applications, 1999, vol. 273, no. 3, pp. 476-485. DOI:https://doi.org/10.1016/S0378-4371(99)00370-2. ; ; EDN: https://elibrary.ru/XSVQVD
11. Tiessen A., Pérez-Rodríguez P, Delaye-Arredondo L.J. Mathematical modeling and comparison of protein size distribution in different plant, animal, fungal and microbial species reveals a negative correlation between protein size and protein number, thus providing insight into the evolution of proteomes. BMC Research Notes, 2012, vol. 5, no. 85. DOI:https://doi.org/10.1186/1756-0500-5-85. ; ; EDN: https://elibrary.ru/XZZVRA
12. Jhang G. Protein-length distributions for the three domains of life. Trends in Genetics, 2000, vol. 16, no. 3, pp. 107-109. DOI:https://doi.org/10.1016/S0168-9525(99)01922-8. ; EDN: https://elibrary.ru/AESBLP
13. Мenzerath P. Architektonik des deutschen Wortschatzes. Bonn, 1954, 131 p.
14. Altmann G. Prolegomena to Menzerath’s law. Glottometrika, 1980, vol. 2, pp. 1-10.
15. Eroglu S. Language-like behavior of protein length distribution in proteomes. Complexity, 2014, vol. 20, pp. 12-21. DOI:https://doi.org/10.1002/cplx.21498.
16. Esposti M.D., De Vries S., Crimi M., Ghelli A., Patarnello T., Meyer A. Mitochondrial cytochrome b: evolution and structure of the protein. Biochim. Biophys. Acta, 1993, vol. 1143, no 3, pp. 243-271. DOI:https://doi.org/10.1016/0005-2728(93)90197-n. ; DOI: https://doi.org/10.1016/0005-2728(93)90197-N; EDN: https://elibrary.ru/XZVBXE
17. Замятнин А.А. Физико-химические и функциональные характеристики полной системы природных олигопептидов. Актуальные вопросы биологической физики и химии, 2018, т. 3, № 1, c. 225-235. @@[Zamyatnin A.A. Physico-chemical and functional characteristics of a complete system of natural oligopeptides. Modern trends in biological physics and chemistry, 2018, vol. 3, no. 1, p. 225-235. (In Russ.)] ; EDN: https://elibrary.ru/VAAAWP