doi: 10.18698/2309-3684-2017-3-119138
Предложены стохастические модели, объясняющие реальные характерные закономерности кодирующих районов из геномов различных организмов. Вследствие нарастающего объема данных по секвенированным геномам возникает проблема их автоматизированного анализа. С использованием этих моделей разработаны методы распознавания структурно-статистических свойств геномных последовательностей ДНК, которые могут быть использованы для разработки алгоритмов и компьютерных программ для автоматизированной обработки большого объема данных. Свойства предложенных стохастических моделей кодирования продемонстрированы в численных экспериментах с бинарно перекодированными абзацами литературных произведений на английском и итальянском языках.
[1] Александров А. А., Димитриенко Ю. И. Математическое и компьютерное моделирование — основа современных инженерных наук. Математическое моделирование и численные методы. 2014, №1 (1), c. 3-4. doi: 10.18698/2309-3684-2014-1-None
[2] Зарубин В. С., Кувыркин Г. Н. Особенности математического моделирования технических устройств. Математическое моделирование и численные методы. 2014, №1 (1), c. 5-17. doi: 10.18698/2309-3684-2014-1-517
[3] Chaley M., Kutyrkin V. Stochastic model of homogeneous coding and latentperiodicity in DNA sequences. Journal of Theoretical Biology. 2016, V. 390, pp. 106–116.
[4] Кутыркин В.А., Чалей М.Б. Модель организации кодирования в прокариотических организмах. Мат. биол. биоинф. 2016, Т. 11, № 1, c. 24–45. doi: 10.17537/2016.11.24
[5] Chaley M., Kutyrkin V. In: Data Mining Techniques for the Life Sciences. Ed. Carugo O., Eisenhaber F. New York: Springer Science+Business Media, 2016, pp. 315–340.
[6] Chaley М., Kutyrkin V. Model of perfect tandem repeat with random pattern and empirical homogeneity testing poly-criteria for latent periodicity revelation in biological sequences. Math. Biosci., 2008, 211, pp.186–204. doi:10.1016/j.mbs.2007.10.008.
[7] Chaley M.B., Kutyrkin V.A. Structure of proteins and latent periodicity in their genes. Moscow Univ. Biol. Sci. Bull. 2010, 65, pp.133–135. doi:10.3103/S0096392510040012.
[8] Chaley M., Kutyrkin V. Profile-Statistical Periodicity of DNA Coding Regions. DNA Res. 2011, 18, pp.353–362. doi:10.1093/dnares/dsr023.
[9] Кутыркин В.А., Чалей М.Б. Спектрально-статистический подход к распознаванию скрытой профильной периодичности в последовательностях ДНК. Мат. биол. биоинф. 2014, Т. 9, № 1, c. 33–62. doi:10.17537/2014.9.33.
[10] Benson G. Tandem repeats finder: a program to analyze DNA sequences. Nucleic Acids Res. 1999, 27, pp.573–580.
[11] Sánchez J. 3-base periodicity in coding DNA is affected by intercodon dinucleotides. Bioinformation. 2011, 6, pp.327–329.
[12] Sokol D., Benson G., Tojeira J. Tandem repeats over the edit distance. Bioinformatics. 2007, 23, pp.30–35. doi:10.1093/bioinformatics/btl309
[13] Marhon S.A., Kremer S.C. Gene prediction based on DNA spectral analysis: a literature review. J. Comput. Biol. 2010, V. 18, pp. 639-676. doi:10.1089/cmb.2010.0184.
[14] Issac B., Singh H., Kaur H., Raghava G.P.S. Locating probable genes using Fourier transform approach. Bioinformatics. 2002, 18, pp.196–97.
[15] Howe E.D., Song J.S. Categorial spectral analysis of periodicity in human and viral genomes. Nucleic Acids Res. 2013, 41, pp.1395–1405. doi:10.1093/nar/gks1261.
[16] Кутыркин В.А., Чалей М.Б. Структурные различия кодирующих инекодирующих районов последовательностей ДНК генома человека.Инженерный журнал: наука и инновации. 2012, 2, с.146157. DOI: 10.18698/2308-6033-2012-2-46
[17] KEGG: Kyoto Encyclopedia of Genes and Genomes. URL: http://www.kegg.jp (дата обращения: 10.05.2017).
Кутыркин В.А., Чалей М.Б. Стохастические модели кодирования и распозна- вание структурно-статистических характеристик кодирующих последовательно- стей. Математическое моделирование и численные методы, 2017, No 3, с. 119–138.
Количество скачиваний: 783