Issn 2072-0297 Молодой учёный Международный научный журнал Выходит еженедельно №3 (137) / 2017 р е д а к ц и о н н а я к о л л е г и я : Главный редактор



Pdf көрінісі
бет39/129
Дата23.11.2022
өлшемі9,13 Mb.
#159594
1   ...   35   36   37   38   39   40   41   42   ...   129
Байланысты:
moluch 137 ch1

Реализация и результаты
Предложенный алгоритм был реализован на языке 
программирования Python и был протестирован на син-
тетической библиотеке чтений. Для хранения графа де 
Брёйна использовалась хэш-таблица, где ключом явля-
ется k — мер (вершина графа), а значением исходящие 
рёбра и идентификационные номера чтений из которых 
были получены эти рёбра.
Синтетический геном имеет длину порядка 100000 ну-
клеотидов, средний размер чтений составляет 50 нуклео-
тидов, число чтений 13168. В эксперименте был проведен 
анализ качества контигов в зависимости от значения па-
раметра k. Для этого для всех k множества {16, 20,26} 
была запущенна сборка.
В каждом случае было определено и записано каче-
ство картирования, насколько хорошо контиги карти-


«Молодой учёный»
.
№ 3 (137)
 .
Январь 2017 г.
28
Информатика
ровались на референсный геном: считалась доля числа 
контигов, в которых доля правильных нуклеотидов была 
больше заданного порога. Результаты приведены в та-
блице 1.
Таблица
 
1.
 Результаты эксперимента по сборке синтетического генома для разных значений k
Длинна k

мера
Качество картирования,%
16
70%
20
81%
26
97%
По итогам проверки качества сборки было выбрано 
значение k = 26.
После получения графа де Брейна встала необходи-
мость произвести сжатие элементарных путей. Был при-
менен алгоритм сжатия, который позволил удалить около 
20000 вершин из 111277. В результате получился граф го-
товый к построению контигов за приемлемое время. Харак-
теристики полученных контигов представлены в таблице 2.
Таблица
 
2.


Достарыңызбен бөлісу:
1   ...   35   36   37   38   39   40   41   42   ...   129




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет