К сожалению, даже этот и так не слишком-то однозначный метод имеет свои недостатки, осложняющие биоинформатический анализ. Во-первых, со временем ген как бы адаптируется к организму, в котором он оказался. То есть нетипичные кодоны в результате последовательных мутаций со временем становятся самыми типичными. Генетики говорят, что гены «одомашниваются» в процессе эволюции[35]. О том, почему это происходит, ученые тоже думают уже очень давно. Об этом мы поговорим немного далее в главе о мутациях. Во-вторых, чтобы искать чужеродный (перенесенный) ген в геноме, надо хотя бы примерно знать, что мы ищем и где именно – в каком месте генома. Иначе такая задача поиска будет достаточно вычислительно сложной, что связано с большой длиной эукариотических[36] геномов и просто огромным количеством комбинаторных вариантов, по которым можно осуществлять поиск.
В таком случае, мы можем понять, имел ли место перенос чужеродного гена в чей-то геном, но уверенность наших выводов будет зависеть от того, случился ли этот перенос относительно недавно (по эволюционным меркам) и были ли донор и реципиент организмами разного вида.
Что же еще есть в арсенале биоинформатиков? Кое-какие методы из тех, что использовал еще Шерлок Холмс. Помнится, доктор Ватсон написал в списке характеристик своего нового соседа: «способен по внешнему виду отличать разные виды почв; после прогулок показывал мне пятна на своих брюках и по их цвету и консистенции определял, какое в каком районе Лондона получено»[37]. Некоторые приемы генной инженерии оставляют от себя вот такие пятна – следы вмешательства, небольшие фрагменты из генетических букв, которые можно найти, если знать, какой именно фрагмент мы ищем, и указывать примерный диапазон поисков в геноме. Почему так происходит и что нужно искать, рассмотрим дальше в главе 3.1. Дело о картошке. Недостатки у этого метода такие же, какие бы помешали и великому сыщику: если ваш подозреваемый притащил на штанах пятна грязи не из районов Лондона, а, скажем, из пригорода Челябинска, то ничего бы эти пятна ему сами по себе о своем происхождении не рассказали – ведь почвы тех мест ему попросту незнакомы. Да и способов не принести с собой на одежде никаких пятен, наверное, столько же, сколько современных технологий редактирования геномов, которые следов в геноме не оставляют.
Ну и уж совсем напоследок биоинформатический метод, который требует довольно высоких вычислительных ресурсов и… наличия явного подозреваемого. Текст конкретного гена (или фрагмента гена) можно приложить по очереди к каждому из известных науке геномов и узнать, на чей ген он больше всего похож. Биоинформатики говорят, что ген нужно выравнять на геном. Тут важно, что выравнивать (прикладывать) надо именно этот самый подозреваемый ген, а не весь (предположительно отредактированный) геном. Потому что, во-первых, при сравнении «в лоб» одного полного генома с другими полными геномами всех известных организмов это будет невероятно вычислительно сложная задача для очень мощного компьютера, которая займет не одни сутки, а то и недели. А во-вторых, сравнение одного генома с другими геномами однозначного ответа все равно не даст – по разным генам организмы могут походить на геномы разных организмов. Ведь эволюция шла очень заковыристыми путями. Отсюда в науке есть даже такая сложная задача – построение эволюционных (так называемых филогенетических) деревьев.
Подводя небольшой итог: опознать, что в геном произведена встройка чьего-то чужого гена, теоретически возможно, но не со 100 %-ной уверенностью. И уровень этой уверенности будет зависеть от того, каким методом производилось редактирование, насколько различны виды, как давно это произошло и знаем ли мы хотя бы примерно, какой именно ген ищем.
1.7. Про белки в белке и белке
Вся эта хитрая магия, описанная в главах выше, нужна в конечном итоге для того, чтобы произвести белок. Тот самый окончательный продукт молекулярной кухни, из которого преимущественно состоит все живое, от клеща до куриного яйца, от гриба до белки.
Итак, по матрице ДНК будет считана нить РНК. По нити РНК на молекулярном заводе – рибосоме – соберут аминокислотную цепь. От этого шага до того, что является выполняющим свою функцию белком, еще далековато. Выстроенные в единую цепочку аминокислоты – это первичная структура белка. Теперь этой цепочке предстоит пройти череду трансформаций. На первой стадии ее фрагменты свернутся в один из двух основных вариантов укладки: a-спираль или b-слой (еще называют b-лист) – вторичную структуру. Как несложно догадаться, в первом случае цепь закручивается в виде спирали, а во втором – фрагменты цепи зигзагом укладываются друг подле друга, образуя фигуру, напоминающую мне гармошку или самодельный бумажный веер. Такая фигура держится за счет водородных связей. Такие связи устанавливаются между функциональными группами (это те части, которые одинаковы у всех аминокислот)[38]. А дальше начинается самое интересное.