Naslov (srp)

Анализа заступљености поновака са применом у предвиђању т-ћелијских епитопа : докторска дисертација

Autor

Jelović, Ana, 1973-

Doprinosi

Malkov, Saša, 1970-
Mitić, Nenad, 1959-
Kovačević, Jovana, 1983-
Ognjanović, Zoran, 1964-

Opis (srp)

Први део овог рада се бави дефинисањем различитих типовапоновака, као и поновака коjи задовољаваjу маске мотива. Развиjен jе методза њихово прецизно проналажење у улазним секвенцама коjе могу битивеома дугачке. Како броj нађених резултата може бити веома велики, методукључуjе и њихово филтрирање на основу очекиваног броjа поjављивања.Метод jе прво примењен на протеинским секвенцама у коjима суекспериментално потврђени Т-ћелиjски епитопи регистровани у бази податакаIEDB. Над нађеним поновцима примењена су правила придруживања у циљуконструисања модела коjи би омогућио предвиђање позициjа Т-ћелиjскихепитопа у протеинским секвенцама. На оваj начин би се истраживачиманаговестио регион у протеинскоj секвенци где се са великом поузданошћуможе очекивати епитоп. У случаjу Т-ћелиjских епитопа нађен jе великиброj правила са високом поузданошћу коjи се могу сматрати поузданиминдикаторима позициjе T-ћелиjских епитопа унутар протеинске секвенце.На основу нађених резултата формирана су и правила придруживањакоjа детаљниjе карактеришу епитопе и са њима повезане поновке. Какоjе нађен велики броj резултата само њихов део jе представљен у раду. Наоснову ниски коjима су одређени поновци са задовољаваjућом поузданошћутражене су и маске мотива коjе jе потребно да поновци задовољаваjу како бипроцес њиховог тражења био што jедноставниjи. Цео поступак jе примењенкако код директних некомплементарних поновака тако и код индиректнихнекомплементарних поновака. Са сличним резултатима jе цео поступакурађен и код Б-ћелиjских епитопа над подацима из базе података IEDB.Подаци о експериментално потврђеним кратким линеарним мотивимасу преузети из базе података ELM и у протеинским секвенцама где сукратки линеарни мотиви регистровани тражени су поновци. Над њима супримењена правила придруживања. Посебно су издвоjена правила са високомпоузданошћу. На основу нађених резултата тражене су маске мотива коjенађени поновци задовољаваjу.

Opis (srp)

Рачунарство - Биоинформатика, Истраживање података / Computer Science - Bioinformatics, Data mining Datum odbrane: 30.09.2022.

Opis (eng)

In the first part of this dissertation different repeat types are definedas well as repeats that satisfy motif masks. A method for precise repeat findingin input sequences of arbitrary length has been described. As the input sequencescan be very long, the number of found repeats can also be large. For that reasonit is important that the method also includes filtering found repeats based on theexpected number of their occurrences.The method was first applied to protein sequences in which experimentallyconfirmed T-cell epitopes from the IEDB database were registered. Associationrules were applied to the found repeats in order to construct a model that wouldenable the prediction of the positions of T-cell epitopes in protein sequences.In this way, it would indicate to researchers a region in the protein sequencewhere an epitope can be expected with high confidence. In the case of T-cellepitopes, a large number of rules with high confidence was found. These rules canbe considered as reliable predictors of the position of T-cell epitopes within theprotein sequences. Based on the results found, association rules were formed thatcharacterize the epitopes and the repeats associated with them in more detail. Asa large number of results were found, only their part is presented in this dissertation. On the basis of the strings that determine the repeat, a motif mask thatthe repeat needs to satisfy was searched for. The entire procedure was applied toboth direct non-complementary repeats and indirect non-complementary repeats.With similar results, the entire procedure was applied to B-cell epitopes on datafrom the IEDB database.Data on experimentally confirmed short linear motifs were taken from the ELMdatabase. In protein sequences where short linear motifs were registered, repeatswere searched for and association rules were applied to them. The rules with highconfidence have been singled out in particular. On the basis of the results found,motif masks that repeats with high confidence would satisfy were searched for.

Jezik

srpski

Datum

2022

Licenca

© All rights reserved

Predmet

OSNO - Opšta sistematizacija naučnih oblasti, Teorija verovatnoće. Matematička statistika

OSNO - Opšta sistematizacija naučnih oblasti, Biološka matematika. Biometrija

поновци, Т-ћелиjски епитопи, кратки линеарни мотиви, правила придруживања

OSNO - Opšta sistematizacija naučnih oblasti, Teorija verovatnoće. Matematička statistika

OSNO - Opšta sistematizacija naučnih oblasti, Biološka matematika. Biometrija

repeats, T-cell epitopes, short linear motifs, association rules