Preview

Труды Института системного программирования РАН

Расширенный поиск

Модификация метода расчета полигенных рисков с использованием графа вариации

https://doi.org/10.15514/ISPRAS-2022-34(2)-15

Аннотация

Представление последовательности ДНК возможно в различном виде. Граф вариации один из самых точных методов, который позволяет работать с нетипичными участками и учитывать все их разнообразие. На основе этой структуры данных и метода полигенной оценки риска была построена система интерпретации ДНК. В результате был получен коэффициент корреляции между путем в графе, отвечающим за конкретную последовательность ДНК, и признаком. Затем мы сравнили его с коэффициентом, полученным аналогичным методом, но использующим представление последовательности с использованием эталонного генома. Такое сравнение помогло оценить эффективность представления в виде графа. После этого был построен модифицированный метод подсчета полигенной оценки на данных выравнивания инструмента vg, который также был сравнен с существующими методами. Модифицированный метод показал улучшение прогноза признака.

Об авторах

Олеся Анатольевна КОНДРАТЬЕВА
Институт системного программирования им. В. П. Иванникова РАН, Московский государственный университет им. М.В. Ломоносова
Россия

Студентка магистратуры кафедры системного программирование МГУ, работает в ИСП РАН



Евгений Андреевич КАРПУЛЕВИЧ
Институт системного программирования им. В. П. Иванникова РАН
Россия

Специалист отдела информационных систем



Список литературы

1. Chaisson M.J., Tesler G. Mapping single molecule sequencing reads using basic local alignment with successive refinement (BLASR): application and theory. BMC Bioinformatics, vol. 13, 2012, article no. 238, 17 p.

2. Li H. Aligning sequence reads, clone sequences and assembly contigs with BWA-MEM. arXiv preprint arXiv:1303.3997, 2013, 3 p.

3. Sović I., Šikić M. et al. Fast and sensitive mapping of nanopore sequencing reads with GraphMap. Nature communications, vol. 7, issue 1, 2017, article no. 11307, 11 p.

4. Lin H.-N., Hsu W.-L. Kart: a divide-and-conquer algorithm for NGS read alignment. Bioinformatics, vol. 33, issue 15, 2017, pp. 2281-2287.

5. Li H. Minimap2: pairwise alignment for nucleotide sequences. Bioinformatics, vol. 34, issue 18, 2018, pp. 3094-3100.

6. Polyanovsky V.O., Roytberg M.A. Tumanyan V.G. Comparative analysis of the quality of a global algorithm and a local algorithm for alignment of two sequences. Algorithms for Molecular Biology, vol. 6, 2011, article no. 25, 12 p.

7. Abouelhoda M.I., Ohlebusch E. Chaining algorithms for multiple genome comparison. Journal of Discrete Algorithms, vol. 3, issues 2-4, 2005, pp. 321–341.

8. Suzuki H., Kasahara M. Introducing difference recurrence relations for faster semi-global alignment of long sequences. BMC bioinformatics, vol. 19, 2018, article no. 45, 14 p.

9. Kim D., Paggi J.M. et al. Graph-based genome alignment and genotyping with HISAT2 and HISAT-genotype. Nature Biotechnology, vol. 37, 2019, pp. 907-915.

10. Li H. Fast and accurate short read alignment with Burrows–Wheeler transform. Bioinformatics, vol. 25, issue 14, 2009, pp. 1754-1760.

11. Simpson J.T., Durbin R. Efficient construction of an assembly string graph using the FM-index. Bioinformatics, vol. 26, issue 12, 2010, pp. i367–i373

12. Rakocevic G., Semenyuk V. et al. Fast and accurate genomic analyses using genome graphs. Nature genetics, vol. 51, 2019, pp. 354-362.

13. Garrison E., Sirén J. et al. Variation graph toolkit improves read mapping by representing genetic variation in the reference. /Nature biotechnology, vol. 36, 2018, pp. 875-879.

14. So H.-C. Improving polygenic risk prediction from summary statistics by an empirical Bayes approach, Scientific reports, vol. 7, 2017, article no. 41262, 11 p.

15. So H.-C. Uncovering the total heritability explained by all true susceptibility variants in a genome-wide association study. Genetic epidemiology, vol. 35, issue 6, 2011, pp. 447-456.

16. Detlef W., R. The 1001 genomes project for Arabidopsis thaliana. Genome biology, vol. 10, 2009, article no. 107, 5p.

17. AraGWAS Catalog. ’M216T665’ URL: http://aragwas.1001genomes.org/#/study/144.

18. Huang W., Li L. et al. ART: a next-generation sequencing read simulator. Bioinformatics, vol. 28, issue 4, 2012, pp. 593-594.

19. Li H. A statistical framework for SNP calling, mutation discovery, association mapping and population genetical parameter estimation from sequencing data. Bioinformatics, vol. 27, issue 21, 2011, pp. 2987-2993.


Рецензия

Для цитирования:


КОНДРАТЬЕВА О.А., КАРПУЛЕВИЧ Е.А. Модификация метода расчета полигенных рисков с использованием графа вариации. Труды Института системного программирования РАН. 2022;34(2):191-200. https://doi.org/10.15514/ISPRAS-2022-34(2)-15

For citation:


Kondrateva O.A., Karpulevich E.A. Modification of the Method for Calculating Polygenic Risks With Variation Graph. Proceedings of the Institute for System Programming of the RAS (Proceedings of ISP RAS). 2022;34(2):191-200. (In Russ.) https://doi.org/10.15514/ISPRAS-2022-34(2)-15



Creative Commons License
Контент доступен под лицензией Creative Commons Attribution 4.0 License.


ISSN 2079-8156 (Print)
ISSN 2220-6426 (Online)