Наличие только одной рамки считывания это

Генные мутации

Наличие только одной рамки считывания это

Виды генных мутаций:

  • Замена азотистых оснований
  • Сдвиг рамки считывания
  • Инверсия в пределах гена

Генные мутации возникаю чаще, чем хромосомные и геномные, но менее значительно меняют структуру ДНК, в основном касаются только химической структуры отдельно взятого гена.

Представляют собой замену, удаление или вставку нуклеотида, иногда нескольких.

Также к генным мутациям относятся транслокации (перенос), дупликации (повторение), инверсии (переворот на 180°) участков гена, но не хромосомы.

Генные мутации происходят при репликации ДНК, кроссинговере, возможны в остальные периоды клеточного цикла. Механизмы репарации не всегда устраняют мутации и повреждения ДНК. Кроме того сами могут служить источником генных мутаций. Например, при объединении концов разорванной хромосомы часто теряется несколько нуклеотидных пар.

Если системы репарации перестают нормально функционировать, то происходит быстрое накопление мутаций.

Если мутации возникают в генах, кодирующих ферменты репарации, то может нарушится работа одного или нескольких его механизмов, в результате чего количество мутаций сильно возрастет.

Однако иногда бывает обратный эффект, когда мутация генов ферментов репарации приводит к снижению частоты мутаций других генов.

Помимо первичных мутаций в клетках могут происходить и обратные, восстанавливающие исходный ген.

Большинство генных изменений, как и мутаций двух других видов, вредны. Появление мутаций, обусловливающих полезные признаки для определенных условий среды, происходит редко. Однако именно они делают возможным процесс эволюции.

Генные мутации затрагивают не генотип, а отдельные участки гена, что, в свою очередь, обуславливает появление нового варианта признака, т. е. аллели, а не нового признака как такового. Мутон — это элементарная единица мутационного процесса, способная приводить к появлению нового варианта признака.

Зачастую, для этого достаточно изменить одну пару нуклеотидов. С этой точки зрения мутон соответствует одной паре комплементарных нуклеотидов. С другой стороны, не все генные мутации являются мутонами с точки зрения последствий.

Если изменение нуклеотидной последовательности не влечет за собой изменения признака, то с функциональной точки зрения мутации не произошло.

Одной паре нуклеотидов соответствует и рекон — элементарная единица рекомбинации. При кроссинговере в случае нарушения рекомбинации происходит неравный обмен участками между конъюгирующими хромосомами.

В результате происходит вставка и выпадение нуклеотидных пар, что влечет сдвиг рамки считывания, в дальнейшем нарушение синтеза пептида с необходимыми свойствами.

Таким образом для искажения генетической информации достаточно одной лишней или потерянной пары нуклеотидов.

Частота спонтанных генных мутаций находится в пределах от 10-12 до 10-9 на каждый нуклеотид ДНК на каждое деление клетки. Для проведения исследований ученые подвергают клетки воздействию химических, физических и биологических мутагенов. Вызванные таким образом мутации, называются индуцированными, их частота выше.

Если происходит изменение только одного нуклеотида в ДНК, то такая мутация называется точечной. В случае мутаций по типу замены азотистых оснований одна комплементарная нуклеотидная пара молекулы ДНК заменяется в ряду циклов репликации на другую. Частота подобных происшествий составляет около 20% от общей массы всех генных мутаций.

Примером подобного является дезаминирование цитозина, в результате чего образуется урацил.

В ДНК образуется нуклеотидная пара Г-У, вместо Г-Ц. Если ошибка не будет репарирована ферментом ДНК-гликолазой, то при репликации произойдет следующее.

Цепи разойдутся, напротив гуанина будет установлен цитозин, а напротив урацила — аденин. Таким образом, одна из дочерних молекул ДНК будет содержать аномальную пару У-А.

При ее последующей репликации в одной из молекул напротив аденина будет установлен тимин. Т. е. в гене произойдет замена пары Г-Ц на А-Т.

Другим примером является дезаминирование метилированного цитозина, в результате которого образуется тимин. В последствии может возникнуть ген с парой Т-А вместо Ц-Г.

Могут быть и обратные замены: пара А-Т при определенных химических реакциях может заменяться на Ц-Г. Например, в процессе репликации к аденину может присоединиться бромурацил, который при следующей репликации присоединяет к себе гуанин. В следующем цикле гуанин свяжется с цитозином. Таким образом в гене пара А-Т заменится на Ц-Г.

Замена одного пиримидина на другой пиримидин или одного пурина на другой пурин называется транзицией. Пиримидинами являются цитозин, тимин, урацил. Пуринами — аденин и гуанин. Замена пурина на пиримидин или пиримидина на пурин называется трансверсией.

Точечная мутация может не привести ни к каким последствиям из-за вырожденности генетического кода, когда несколько кодонов-триплетов кодируют одну и ту же аминокислоту. Т. е.

в результате замены одного нуклеотида может образоваться другой кодон, но кодирующий ту же аминокислоту, что и старый. Такая замена нуклеотидов называется синонимической. Их частота около 25% от всех замен нуклеотидов.

Если же смысл кодона меняется, он начинает кодировать другую аминокислоту, то замена называется мисенс-мутацией. Их частота около 70%.

В случае мисенс-мутации при трансляции в пептид будет включена не та аминокислота, в результате чего его свойства изменятся.

От степени изменения свойств белка зависит степень изменения более сложных признаков организма. Например, при серповидно-клеточной анемии в белке заменена лишь одна аминокислота — глутамин на валин.

Если же глутамин заменяется на лизин, то свойства белка меняются не сильно, т. е. обе аминокислоты гидрофильны.

Точечная мутация может быть такой, что на месте кодирующего аминокислоту кодона возникает стоп-кодон (УАГ, УАА, УГА), прерывающий (терминирующий) трансляцию. Это нонсенс-мутации. Иногда бывают и обратные замены, когда на месте стоп-кодона возникает смысловой. При любой подобной генной мутации функциональный белок уже не может быть синтезирован.

Сдвиг рамки считывания

К генным относятся мутации обусловленные сдвигом рамки считывания, когда происходит изменение количества нуклеотидных пар в составе гена. Это может быть как выпадение, так и вставка одной или нескольких нуклеотидных пар в ДНК. Генных мутаций по типу сдвига рамки считывания больше всего. Наиболее часто они возникают в повторяющихся нуклеотидных последовательностях.

Вставка или выпадение нуклеотидных пар может произойти в следствие воздействия определенных химических веществ, которые деформируют двойную спираль ДНК.

Рентгеновское облучение может приводить к выпадению, т. е. делеции, участка с большим количеством пар нуклеотидов.

Вставки нередки при включении в нуклеотидную последовательность так называемых подвижных генетических элементов, которые могут менять свое положение.

К генным мутациям приводит неравный кроссинговер. Чаще всего он происходит в тех участках хромосом, где локализуются несколько копий одного и того же гена. При этом кроссинговер происходит так, что в одной хромосоме возникает делеция участка. Этот участок переносится на гомологичную хромосому, в которой возникает дупликация участка гена.

Если происходит делеция или вставка числа нуклеотидов не кратного трем, то рамка считывания сдвигается, и трансляция генетического кода зачастую обессмысливается. Кроме того, может возникнуть нонсенс-триплет.

Если количество вставленных или выпавших нуклеотидов кратно трем, то, можно сказать, сдвиг рамки считывания не происходит. Однако при трансляции таких генов в пептидную цепь будут включены лишние или утрачены значащие аминокислоты.

Инверсия в пределах гена

Если инверсия участка ДНК происходит внутри одного гена, то такую мутацию относят к генным. Инверсии более крупных участков относятся к хромосомным мутациям.

Инверсия происходит вследствие поворота участка ДНК на 180°. Часто это происходит при образовании петли в молекуле ДНК. При репликации в петле репликация идет в обратном направлении. Далее этот кусок сшивается с остальной нитью ДНК, но оказывается перевернутым наоборот.

Если инверсия случается в смысловом гене, то при синтезе пептида часть его аминокислот будет иметь обратную последовательность, что скажется на свойствах белка.

plustilino © 2019. All Rights Reserved

Источник: https://biology.su/genetics/gene-mutation

Безопасность СКУД: технологии идентификации и форматы карт

Наличие только одной рамки считывания это

26.12.2014

Одним из ключевых критериев оценки СКУД является безопасность на всех уровнях цепочки идентификатор – считыватель – контроллер – сервер – удаленное рабочее место. В данной статье мы рассмотрим наиболее актуальный вопрос – безопасность передачи данных от идентификатора к считывателю.

Идентификаторы как часть нашей жизни

Сложно представить современный мир без контактных и бесконтактных технологий идентификации.

Использование банковских карт (с магнитной полосой, карты с чипом EMV, бесконтактные платежи PayPass, payWave); RFID-карты для транспорта, сферы развлечений и программ лояльности: выдача полисов ОМС и социальных карт москвича и, конечно же, карты физического доступа и логического доступа к компьютеру и ИТ-ресурсам компании – наиболее яркие примеры повсеместного применения идентификаторов

Существующие технологии на участке коммуникаций между считывателем и картой

Если взглянуть на историю развития систем, мы увидим, что первые из них, использующие электронно-вычислительную технику, были применены еще в конце XIX века в виде электрических табулирующих систем Hollerith technology, в которых вместо современных считывателей и карт использовались табуляторы и перфокарты.

На сегодняшний день благодаря естественному прогрессу на смену огромным машинам (табуляторам) и картону (перфокарта) пришли компактные высокотехнологичные устройства.

Основные технологии:

  • Штрих-код
  • Магнитная полоса
  • Wiegand-карта
  • EM Marine (125 КГц)
  • Prox (производитель HID Global, 125 КГц)
  • Legic (производитель Legic, 1992 год)
  • Mifare (производитель Philips, 1994 год)
  • Mifare DESFire (производитель Philips, 2006 год, 13,56 МГц)
  • iCLASS SE (производитель HID Global, 2012 год, 13,56 МГц)

Остановимся на более распространенных радиочастотных технологиях с частотой 125 КГц (EM Marine, HID Prox, Indala) и 13,56 МГц (Mifare DESFire, iCLASS SE)

Уязвимость технологий считывания

В первую очередь определимся с тем, что карта – это идентификатор пользователя, на котором содержится некая информация – ключ, открывающий дверь или доступ к ресурсам. Именно поэтому вопрос безопасности передачи данных от идентификатора к считывателю, как никогда, актуален.

Степень риска копирования информации с карт и их клонирования увеличивается ежедневно, и это заставляет более осознанно подходить к выбору технологий, обеспечивающих безопасную идентификацию.

Как правило, уязвимость оценивают по трем основным угрозам, выявленным в процессе эксплуатации бесконтактных карт: повторное воспроизведение, клонирование и конфиденциальность данных. Cм. таб. 1.

Исходя из таблицы, можно сделать вывод, что среди всех радиочастотных технологий карты 125 кГц наиболее уязвимы с точки зрения уровня безопасности в связи с возможностями:

  • повторного воспроизведения, так как при каждом чтении карты передается одна и та же информация, которую можно перехватить, записать и воспроизвести для получения доступа в помещение
  • клонирования программатором незаметно для владельца карты
  • незащищенности конфиденциальных данных – идентификатор хранится в открытом виде и никак не защищен от считывания

Рассмотрим основные способы защиты от угроз, заложенные в алгоритм работы смарт-карт. Обратная связь между устройствами является ключевым вопросом обеспечения безопасной идентификации в цепочке карта – считыватель.

Угроза безопасности
Повторное воспроизведениеКлонированиеКонфиденциальность данныхДополнительный уровень безопасности
Защита от угроз
Взаимная аутентификацияДиверсификация ключаШифрование DES, 3DES, AESПривязка к UID/CSN, CMAC 96
Технология RFID
EM MarineНетНетНетНет
MifareДа, но открытаяНетНетНет
DESFire EV1ДаДаДаНет данных
iCLASS SEДаДаДаДа

Таблица 1

Карта, попадая в зону считывания, предоставляет ридеру свой уникальный номер CSN и сгенерированный 16-битный случайный номер. В ответ считыватель, используя Hashалгоритм, создает диверсификационный ключ, который должен совпасть с ключом, записанным на карте. При совпадении карта и считыватель обмениваются 32-битными откликами, после чего считыватель «принимает» решение о валидности карты.

Таким образом, защита карт 13,56 МГц от обозначенных выше угроз обеспечивается за счет взаимной аутентификации между картой и считывателем, процесс которой происходит в зашифрованном виде с формированием и подтверждением ключа диверсификации.

Однако идентификатор сегодня – это больше, чем пропуск в помещение. Сегодня все чаще используется единый идентификатор, который обеспечивает доступ как в здание и служебные помещения, так и к корпоративной информации и управлению ИТ-средой. Это требует от производителя карт дополнительных мер для обеспечения безопасной идентификации.

Среди них следует выделить технологию Secure Identity Object™ (SIO), которая обеспечивает многоуровневую защиту данных и представляет собой электронный контейнер для хранения данных в любом из форматов карт.

Вкратце о технологии: во время кодирования карты происходит привязка к уникальному идентификатору носителя UID с последующим заверением записанной информации электронной подписью. Присвоение UID и наличие электронной подписи исключают возможность копирования информации и взлома защиты карты.

Определяемся с форматом карт

Формат бесконтактной карты доступа определяет количество бит и способ их комбинирования, к примеру, карта формата EM4100 (EM Marine) работает на частоте 125 кГц и содержит уникальный номер длиной в 40 бит, который присваивается в дальнейшем пользователю.

Все старательно избегают этого вопроса, хотя ответ на него имеет первостепенную важность при выборе и программировании любых средств доступа.

Немаловажным критерием безопасности карт как носителей информации является культура их производства, отношение владельца технологии к организации процесса выпуска.

В отличие от EM4100 представленные на рынке смарт-карты могут содержать несколько областей памяти, серийный номер CSN, номер и серию (или фасилити код), а также другую служебную информацию. Так, корпорация HID Global предлагает различные форматы карт, на каждом из которых могут содержаться различные технологии безопасности. См. таб. 2.

Выбор формата имеет серьезное значение как для работы системы, так и для ее безопасности. Что такое формат?

Формат – это структура данных, хранящихся в памяти средства доступа. По своей сути это набор двоичных цифр (бит), в определенном порядке образующих двоичное число, которое система контроля преобразует в код доступа. Количество единиц и нулей и способ их комбинирования определяют формат, в котором зашифрован код доступа.

Так, 26-битный открытый формат H10301 допускает 255 кодов объекта (фасилити кодов), в каждом из которых возможны 65 535 комбинаций номеров карт. При этом производитель не контролирует и не ограничивает производство карт данного формата, что увеличивает риск их дублирования.

В отличие от формата H10301 формат H10304 имеет 37-битную длину кода и позволяет задавать 65 535 кодов объектов и более 500 000 номеров карт для каждого кода объекта, что существенно увеличивает диапазон карт. Помимо этого производитель отслеживает производство этих карт.

Формат Corporate 1000 представляет собой 35-битный формат, разработанный как собственный закрытый формат для крупных компаний.

Таким образом, при выборе технологии идентификации для организации системы СКУД рекомендуем обратить внимание на форматы карт. Выбор и использование того или иного формата также оказывает влияние на общий уровень безопасности системы.

Формат
Технология RFIDH10301H10302H10304Corporate 1000
Prox
Indala
iCLASS
iCLASS SE
SeoS

Таблица 2

Преемственность и совместимость технологий

Под преемственностью технологий принято понимать поддержку со стороны производителя ранее выпущенных продуктов и возможность работы старых и новых технологий в рамках одной системы.

Все преимущества преемственности технологий проявляются во время модернизации или масштабирования точек доступа или функционала системы. При этом в рамках СКУД стоит рассматривать преемственность как со стороны аппаратной части (поддержка или перепрошивка считывателей и контроллеров, одновременное использование карт), так и программного обеспечения.

Как правило, в процессе модернизации или расширения систем контроля доступа применима одна из схем: полная или частичная замена оборудования, полная или частичная замена программной части.

При частичной замене оборудования, как правило, используют мультиформатные (комбинированные считыватели) и/или мультиформатные карты доступа.

Таким образом, преемственность технологий обеспечивает оптимальный способ последующего апгрейда системы без полной замены аппаратной части системы.

Совместимость технологий разных производителей позволяет использовать различные технологии и форматы идентификаторов в рамках одной системы. Как правило, это оптимальное решение для объектов, на которых уже используются определенные технологии, функционирует система, и процесс миграции на новые технологии осуществляется поэтапно без остановки процессов на предприятии.

Резюме

Идентификаторы в системе в СКУД сегодня – это больше чем «таблетки» Touch Memory и proximity карты. Вопрос защищенности технологий идентификации не менее актуален, чем анализ и оценка функционала и возможностей системы на уровне ПО.

Помимо традиционных способов защиты карт – взаимной аутентификации устройств, шифрования данных и использования ключей диверсификации – на рынке представлены решения, обеспечивающие дополнительный уровень безопасности при передаче данных от идентификатора к считывателю. Одно из решений – платформа SIO, получившая распространение в устройствах iClass SE.

Дополнительным критерием выбора технологии идентификации является формат карты. Отдельным вопросом является защищенность формата производителем, а также культура производства карт.

Преемственность технологий, которую обеспечивает производитель в процессе эволюции своих решений, и совместимость технологий разных производителей, которую можно организовать в рамках одной системы, – это концептуальные вещи, которые необходимо учитывать как при выборе и монтаже системы СКУД с нуля, так и для организации процессов модернизации действующих систем контроля доступа, их расширения и встраивания в бизнес-процессы компании.

Владимир Нарожный,
руководитель направления брендинга и интегрированных маркетинговых коммуникаций

Юрий Кондратьев,
менеджер по системам безопасности TerraLink

в журнале «Технологии Защиты», #4, 2014

Источник: https://idcards.ru/materials/publications/15497/

Учебный сайт Макаровой Надежды

Наличие только одной рамки считывания это

  • seqret – объединяет несколько fasta-файлов в один. Здесь: был получен fasta-файл содержащий псоледовательности белков, чей идентификатор в базе SwissProt (проверенных белков) заканчивается на 56.

  • seqretsplit – разбивает один файл на несколько fasta-файлов. Здесь: из файла, содержащего последователньости белков, чей идентификатор начинается с 25 было получено 5 fasta-файлов, содержащих по одной йпоследовательности.

  • transeq – транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные, используя указанную таблицу генетического кода. Здесь: последовательности в файле ex3.fasta Транслирует в один файл согласно бактериальной таблице генетического кода.

  • transeq – транслировать кодирующие последовательности, лежащие в одном fasta файле, в аминокислотные в 6 рамках. Здесь: последовательности в файле ex5.fasta транслируется в один файл в 6 рамках.
  • seqret Программа seqret часто используется для перевода выравнивания из одного формата в другой. Здесь: из выравнивания в fasta-формате получили выравнивание формата aln.

  • featcopy Переводит аннотации особенностей в записи формата .gb в табличный формат .gff

  • cusp Определяет частоты кодонов в данных кодирующих последовательностях. Результат здесь.

  • compseq Определяет частоты динуклеотидов в данной нуклеотидной последовательности и сравнивает их с ожидаемыми. Результат здесь.

Открытая рамка считывания (Open Reading Frame – ORF) – это последовательность нуклеотидов, разбитая на триплеты для трансляции в последовательность аминокислот. Начинается инициирующим кодоном, заканчивается терминирующим. В зависимости от стартовой точки на двух цепях существует 6 рамок считывания.

Если внутри рамки считывания встречается стоп-кодон, то белок с нее не считывается (рамка блокирована). В данном задании нужно получить все возможные трансляции открытых рамок, отвечающих заданным параметрам, и сравнить с аннотациями генов.

Аннотации генов – это нахождение или предсказание функционально важных участков генома (например, кодирующих РНК, белок или регуляторный участок). Они создаются путем сравнения участков генома либо с транскриптомом, либо с протеомом. Иногда функцию участка генома становится вазможно узнать, выравнивая последовательность с уже известными геномами.

Есть и другие подходы. В данной работе можно наглядно увидеть, что наличие открытой рамки (найденной программой) считывания еще не гарантирует существование белка.

В качестве объекта изучения была выбрана бактерия, изучаемая в первом семестре, Amycolatopsis orientalis HCCB10007

Трансляция открытых рамок считывания

C сайта NCBI я скачала файл в формате GenBank (gb) с аннотированной последовательностью кольцевой хромосомы ДНК (ACCESSION: NC_021252).

Далее, использовав программу getorf пакета EMBOSS, я получила список трансляций открытых рамок считывания данной хромосомы.
Описание команды: getorf -sequence sequence.gb -outseq translation.txt -table 11 -minsize 180 -circular Y -find 0.

Что означает: данная программа будет искать в файле (-sequence sequence.

gb) с последовательностью нуклеотидов кольцевой хромосомы (-circular Y) рамки считывания от стоп-кодона до стоп-кодона (-find 0) длиной не менее 180 нуклеотидов (-minsize 180) и транслировать их в соответствии с бактериальной таблицей генетического кода (-table 11). Выходной файл представлен здесь.

Затем, чтобы сделать полученные данные более доступными, была использована программа infoseq пакета EMBOSS.
Описание команды: infoseq translation.txt -outfile table_translation.txt -only -name -length -description .

Что означет: данная программа, проанализировав файл (translation.txt), запишет в файл (-outfile table_translation.txt) только (-only) информацию об ID открытой рамки (-name), координатах в геноме (-description) и длине трансляции в остатках (-length).

Выходной файл представлен здесь.

C помощью следующего скрипта полученные данные были отформатированы. В итоге, былв создана таблица трансляций рамок считывания.

Получения списка аннотированных генов белков

В браузере Genome NCBI была найдена и скачана таблица аннотированных генов белков. C помощью скрипта полученные данные были отформатированы. В итоге, былв создана таблица аннотированных генов белков . Так же был скачан файл c последовательностями всех белков, закодированных в хромосомной ДНК Amycolatopsis orientalis HCCB10007

Изучение полученных данных

Отсортированная по очередности в последовательности и по принадлежности к прямой или обратной цепи таблица представлена здесь. Ярко-желтым представлены рамки считывания, найденные программой getorf в прямой цепи. Бледно-желтым – в обратной. Ярко-синим показаны предсказанные белок-кодирующие гены в прямой цепи, бледно-синим – в обратной.

Далее приведены несколько примеров расхождения между трансляциями открытых рамок, выполненных программой getorf и аннотированными участками генома, а так же их объяснение

  • 1. Для иллюстрации стандарта было решено пойти по последовательности и найти наименее расходящиеся участки. Выбран следующий фрагмент – см.рис1.

    Рис.1 Первое выбранное расхождение. Выделено красным.

    Расхождение в конце последовательности всего в три нуклеотида! ORF длиннее аннотированной последовательности (алгоритм getorf ищет от стоп-кодона до стоп-кодона, а в аннотированной – от старт-кодона до стоп-кодона => меньше). Взглянув на последовательность (см.рис2), стало понятно, что различие в три нуклеотида наблюдается из-за того, что аннотированная запись включила в координаты стоп_кодон TGA. Данное расхождение наиболее часто встречается и служит критерием достоверности правильного выбора ORF

    Рис.2 Расположение стоп кодона 3666-3669. Выделено красной рамкой.

  • 2. Во втором примере представлена проблема, связанная с длинной ORF. Из рис.3 можно заметить, что наиболее подоходящая последовательность ORF1 прерывается стоп-кодоном. Следом за ней идет довольно большая ORF2. В связи с этим возникает несколько вопросов: почему в предсказанном гене hypothetical protein, “игнорируется” стоп-кодон, которым заканчивается ORF1 и почему в большой ORF2 “игнорируется” стоп-кодон, которым заканчивается аннотированная последовательность. Это объясняется тем, что getorf ищет те рамки, размер которых больше указанного (180 н). Поэтому он “разбивал” последовательность, избегая коротких ORF. Пусть в последовательности, кодирующей hypothetical protein есть последовательность TGA, но так как там другая рамка считывания, то она не блокируется. Также и в ORF2.

    Рис.3 Второе выбранное расхождение. Выделено красным.

  • 3. Еще один пример расхождения данных из-за длины последовательности. На этот раз аннотированной. Так как длина белка меньше 60, программа не нашла хотя бы немного похожей ORF.

    Рис.4 Третье выбранное расхождение.

  • 4. В комплементарной цепи ДНК так же есть большое количество расхождений 1-ого типа. Только теперь первые позиции отличаются на 3 нуклеотида (см.рис.5)

    Рис.5 Четвертое выбранное расхождение. Выделено красным.

  • 5. Этот пример интересен тем, что концы двух ORF (с номерами 20597 и 20599) правильно определены. Однако одна ORF(20597) включает целых две кодирующих последовательностей. Аннотированные участки идут непрерывно друг за другом. getorf определил правильно stop-кодон первого, но почему, определив правильно stop-кодон второго ( => при этом рамка считывания не поменялась: так как аннотированные последовательности образуют тандем) программа не разделила две ORF? Вероятно, это ошибка программмы.

    Рис.6 Пятое выбранное расхождение. Выделено красным.

Другие схожие примеры расхождений представлены в Excel-файле. Они выделены красным.

Перекрывание антипараллельных рамок считывания

Чтобы найти примеры данного явления, нужно понимать, что getorf использует для обратной цепи нумерацию прямой, но читает ее в обратном порядке!. Будем считать перекрывание “нужным”, если его длина больше 150н.

Я решила выбрать те антипаралельные ORF, которые содержат аннотированные последовательности и перекрываются , так как рассмотрение любых пересечений антипараллельных рамок не имеет смысла, так как программа ищет все возможные рамки, но не факт, что они реализуются в геноме.

Для этого я выбрала два рядом лежащих, но на противоположных цепях довольно длинных белка (на других не наблюдалось). Данные рамки изображены на рисунке7. Схему перекрывания можно посмотреть на рисунке8.

Рамка с номером 77511 на обратной цепи имеет длину 483 и содержит последоватленьость, кодурющию белок malyl-CoA_lyase (закрашенный зеленый прямоугольник) перекрывается с рамкой с номером 300 имеющейц длину 766 и кодирующей белок serine/threonine_protein_kinase(закрашенный серый прямоугольник) 355 нуклеотидами. Показалось интересным, что для каждой белок-кодирующей последовательности есть рамка считывания, но на противоположной цепи (выделены желтым). Причина такого перекрывания – алгоритм getorf(стоп-стоп). При распозновании старт кодона данного перекрытия не было бы.

Рис.7 Пример перекрывания антипараллельных рамок считывания

Рис.8 Схема перекрывания антипараллельных рамок считывания

Рис.9 Схема перекрывания антипараллельных рамок считывания.

Рис.10 Последовательность участка, который присутствует антипараллельных ORF, но не включается ни в одну аннотированную последовтельность.

Чтобы найти другой пример перекрывания, когда рамка считывания перекрывается вследствии перекрывания генов, нужно найти перекрывания аннотированных последовательностей. Выбрав перекрывание соседних антипаралельных аннотированных последовательностей (с помощью Excel), я выяснила что больше всего они перекрываются в самом начале.

Но на основе этих данных мне не удалось найти подходящий пример перекрывания ORF: везде где аннотированные последовательности перекрываются более чем на 150н, там рамка определена неподходяще (т.е. разбита с целью избежать коротких ORf). Однако нужно сказать, что такое явление довольно роспространено у организмов с маленькими геномами (бактерий и вирусов).

Они вынуждены плотно упаковывать свои гены => происходит перекрывание.

Дата последнего изменения: 10.10.15
© 2014 Макарова Надежда

Источник: https://kodomo.fbb.msu.ru/~anandia/term3/block2/pr9/pr9.html

Медицина и здоровье
Добавить комментарий

;-) :| :x :twisted: :smile: :shock: :sad: :roll: :razz: :oops: :o :mrgreen: :lol: :idea: :grin: :evil: :cry: :cool: :arrow: :???: :?: :!: