Но длинные некодирующие РНК не имеют таких ярко выраженных нуклеотидных индикаторов (в отличие от генов, кодирующих белки). Кроме того, у разных видов они сильно отличаются. Таким образом, знание нуклеотидной последовательности длинной некодирующей РНК какого-то другого вида едва ли поможет нам идентифицировать функционально схожую с ней последовательность в геноме человека. Менее 6% из представителей одного специфического класса длинных некодирующих РНК рыбы данио-рерио, популярного модельного животного, явно имеют аналогичные последовательности у мышей и человека. Лишь примерно 12% представителей того же класса длинных некодирующих РНК, обнаруживаемых у человека и мышей, можно найти у каких-то других животных. Такое сравнительно слабое сохранение длинных некодирующих РНК в разных видах подтвердилось в ходе недавнего исследования, где сравнивалась экспрессия длинных некодирующих РНК из различных тканей разных видов четвероногих. Четвероногие (тетраподы) — все сухопутные позвоночные, в том числе и те, что «вернулись в море» (скажем, киты или дельфины). Исследователи сообщают, что 11 тысяч длинных некодирующих РНК обнаруживаются лишь у приматов. Лишь 2500 таких РНК являются общими для всех тетрапод, и только 400 из них можно отнести к древним, то есть (по определению авторов исследования) к таким, которые возникли свыше 300 миллионов лет назад, примерно в ту эпоху, когда разошлись эволюционные пути амфибий и других тетрапод. Авторы полагают, что эти древние длинные некодирующие РНК — как раз те, которые во всех организмах регулируются наиболее активно, и что они, вероятно, играют роль главным образом на ранних стадиях развития организма. На самых ранних стадиях эмбриогенеза большинство позвоночных выглядят очень похоже. Так что логично предположить: в самом начале нашей жизни мы и все наши близкие и дальние эволюционные родичи используем схожие пути и механизмы развития.
Несходство длинных некодирующих РНК у разных видов (наблюдающееся почти повсеместно) заставило некоторых авторов счесть, что такие РНК вообще не играют важной роли. Ведь если бы они имели большое значение, то меньше бы менялись в ходе эволюции и развития видов. На самом же деле последовательности, которые содержат код для этих «мусорных» РНК, эволюционируют гораздо стремительнее, чем последовательности, кодирующие белки.
Что ж, логично. Однако здесь все-таки есть чрезмерное упрощение. Возможно, длинные некодирующие РНК и длинны по количеству содержащихся в них нуклеотидных оснований, но это не обязательно значит, что они представляют собой какие-то вытянутые волокна, плавающие в клетке. Дело в том, что длинные молекулы РНК способны складываться, образуя трехмерные структуры. Нуклеотидные основания РНК образуют пары, почти по тем же правилам, которым следуют две соединяющиеся нити ДНК. Но РНК — молекула однонитевая, поэтому ее нуклеотидные основания спариваются лишь на сравнительно коротких отрезках. В итоге молекула изгибается, принимая сложные, но стабильные формы. Эти трехмерные структуры могут играть очень важную роль в функционировании длинной некодирующей РНК. Вполне возможно, что сама такая трехмерная структура во многом схожа у разных видов, даже если ее нуклеотидная последовательность у них сильно отличается. Это показано на рис. 8.1. К сожалению, трудно строить предсказания насчет схожести таких структур, основываясь на данных о нуклеотидной последовательности. Но такая методика все же полезна для нахождения функционально устойчивых длинных некодирующих РНК.
Рис. 8.1. Схема показывает, как две однонитевые молекулы длинной некодирующей РНК с различными нуклеотидными последовательностями могут образовывать структуру одной и той же формы. Структура определяется правилами образования пар. Нуклеотид А связывается только с У, а нуклеотид Ц — только с Г (они показаны квадратиками с различной окраской или узором). Перед вами упрощенная схема. На самом деле длинные некодирующие РНК могут обладать множеством участков, способных формировать сложные структуры. Кроме того, эти структуры трехмерны (здесь они для простоты изображены как плоские).
Из-за трудностей, которые возникают при выявлении длинных некодирующих РНК в нуклеотидной последовательности человеческого генома, большинство исследователей сейчас склоняются к более прагматичному подходу их идентификации — детектируют сами эти молекулы непосредственно в клетках. Однако в научном сообществе нет единого мнения насчет интерпретации результатов таких изысканий. Ярые сторонники мусорных последовательностей могли бы заявить: если какая-то последовательность экспрессируется как длинная некодирующая молекула РНК, эта молекула экспрессируется так по какой-то причине. Другие ученые настроены более скептически. Они утверждают, что такая экспрессия длинных некодирующих РНК — просто «сопутствующее событие». Иными словами, они считают, что экспрессия длинных некодирующих РНК — просто своего рода побочный эффект, возникающий при включении «настоящего» гена.
Что же имеется в виду под «сопутствующим событием»? Допустим, мы отпиливаем сучья бензопилой. Основная цель нашей деятельности — получить бревна, чтобы построить дом или приготовить дрова для печки. Мы не стараемся получить щепки или опилки, но они все равно возникают в результате работы бензопилы. Незачем тратить силы, пытаясь избежать щепок. Они, в общем-то, не мешают выполнению нашей основной задачи. А если мы все-таки найдем способ от них избавиться, это может снизить эффективность производства бревен. А кроме того, ведь мы можем случайно натолкнуться на метод использования щепок и опилок (побочного продукта нашего производства). К примеру, для мульчирования почвы в цветочном горшке или при устройстве логова для ручной змеи.