29 марта 2024, пятница, 09:39
TelegramVK.comTwitterYouTubeЯндекс.ДзенОдноклассники

НОВОСТИ

СТАТЬИ

PRO SCIENCE

МЕДЛЕННОЕ ЧТЕНИЕ

ЛЕКЦИИ

АВТОРЫ

21 августа 2009, 08:16

Что такое биоинформатика

Мы публикуем стенограмму передачи «Наука 2.0» - совместного проекта информационно-аналитического канала «Полит.ру» и радиостанции «Вести FM». Гость передачи – доктор биологических наук, кандидат физико-математических наук, заведующий лабораторией и заместитель директора по науке Института проблем передачи информации РАН, профессор Факультета биоинженерии и биоинформатики МГУ Михаил Гельфанд. Услышать нас можно каждую субботу после 23:00 на волне 97,6 FM.

 См. также:

Анатолий Кузичев: В эфире программа «Наука 2.0». Это совместный проект портала «Полит.Ру» и радиостанции «Вести FM». Борис Долгин и Дмитрий Ицкович в качестве представителей «Полит.Ру», Анатолий Кузичев от «Вестей FM» и Михаил Гельфанд от цеха биологов.

Борис Долгин: Биоинформатиков.

А.К.: Так корректно сказать?

Михаил Гельфанд: Так конкретней, чем просто «биологов», потому что еще остались такие биологи, которые биоинформатиков за биологов не признают и поэтому будут расстроены.

А.К.: Хорошо. Михаил Гельфанд из цеха биоинформатиков. Профессор факультета биоинженерии и биоинформатики МГУ, доктор биологических наук, кандидат физико-математических наук, заведующий лабораторией и заместитель директора по науке Института проблем передачи информации РАН. Не считая того института, о котором вы сказали, а я забыл.

Б.Д.: Это не институт, а стипендия.

М.Г.: Это грант международного Института Говарда Хьюза.

А.К.: Мы хотели поговорить с вами о биоинформатике. Мы не из тех биологов, которые не признают биоинформатику. Мы вообще не из биологов, поэтому хотелось бы сначала узнать, что это такое.

М.Г.: Это замечательная область деятельности, которая возникла вот из чего. Технологический прогресс в области обеспечения молекулярно-биологических исследований привел к тому, что данные стали поступать в очень больших объемах. Если раньше, грубо говоря, было так: один белок – один эксперимент – одна статья, то теперь в одном эксперименте вы изучаете сразу тысячу белков или тысячу генов. И это все равно одна статья. Только когда вы смотрите на тысячу объектов, у вас возникает необходимость смотреть на них с более общей точки зрения. Появилась такая деятельность где-то в середине 1980-х годов. Мне страшно повезло, потому что я тогда как раз закончил университет. Я интересовался биологией, а когда был маленьким, интересовался лингвистикой. Я заканчивал мехмат, и уже тогда было ясно, что математикой у меня плохо получается заниматься. И мне безумно повезло, что ровно к этому моменту образовалась такая замечательная наука, которая интегрирует все это. Биоинформатика долгое время была наукой для неудачников, потому что туда приходили криворукие биологи, несложившиеся математики и т. д. И отношение долго было соответствующим. Но как только стали приходить такие массовые данные, оказалось, что какие-то абсолютно внятные биологические утверждения можно делать, не проводя собственных опытов, а глядя на результаты массовых опытов, которые делают другие и свободно выкладывают в Интернете.

Биоинформатика – это способ заниматься биологией, не наблюдая живые существа, как зоологи, не делая опытов в пробирке, как экспериментальные биологи, а анализируя результаты массовых данных или целых проектов. Там есть два аспекта. Один – чисто практический. Оказывается, глядя на буковки, или на структуры белков, или на карты белковых взаимодействий, которые получены из таких массовых экспериментов, вы можете делать совершенно конкретные, проверяемые биологические утверждения.

Б.Д.: Например?

М.Г.: Например, у этого белка функциональный центр связывания малой молекулы находится в этом месте. Или этот ген регулируется таким-то образом и будет включаться в такой-то ситуации. Это абсолютно конкретные биологические утверждения. Конечно, вместо «какой-то ген» я могу говорить конкретные слова, но не уверен, что это поучительно.

Дмитрий Ицкович: Это звучит заманчиво. Можно какое-нибудь конкретное слово?

М.Г.: Пожалуйста. Бактериальная АТФаза регулируется фактором транскрипции FNR. Но это непроверенное предсказание. Из проверенных. Паралоги рибосомных белков регулируются цинковым репрессором, из чего мы делаем вывод, что рибосома[1] может работать как депо цинка. Это глубокое биологическое утверждение, которое было сначала предсказано, то есть сформулировано в виде предсказания, а потом было проверено и оказалось, что так и есть.

Д.И.: Полный нокдаун.

М.Г.: Хотели – получили! Это история про то, что какие-то гены включаются в каких-то условиях. Из этого мы делаем вывод, что есть некая физиологическая система, которая регулирует уровень цинка в клетке. Основная роль этой системы совершенно другая. Рибосома, вообще говоря, не тем занимается. Это страшно важный объект. И то, что у нее есть «дело на стороне», было абсолютно неожиданным.

Б.Д.: Мне кажется, методологически это очень правильная для науки ситуация, когда исследователь может сделать некое утверждение, которое дальше может быть проверено экспериментально.

М.Г.: Да. Возможность делать такие утверждения – это было первое, на чем биоинформатики сломали экспериментальных биологов. Это случилось, когда накопилась некая критическая масса таких оправдавшихся предсказаний, основанных на непонятных методах – вы на компьютере сравниваете последовательности, используя алгоритмы сравнения слов.

Б.Д.: Слов?

М.Г.:  Белок – это последовательность аминокислот[2]. Эту последовательность можно рассматривать как слово.

Д.И.: Длинное?

М.Г.: Характерный белок – это 300 аминокислот у бактерий, порядка 600 у человека. Функциональный центр значительно короче, а всё остальное занимается поддержанием структуры. И это первое, на чем биоинформатики до некоторой степени «заломали» экспериментальных биологов. Когда критическая масса таких нетривиальных предсказаний выросла (то, что я назвал, – это простые предсказания), оказалось, что из этих палочек и веревочек можно сконструировать какие-то более тонкие методы, которые делают неожиданные предсказания. Когда несколько таких методов появилось, стало ясно, что эти ребята что-то...

Д.И.: Знают.

М.Г.: Скорее умеют, чем знают.

Б.Д.: Сейчас диалог налажен?

М.Г.: Да, конечно. Вторая вещь. Это началось с чистой техники. Размер генома человека – 3 миллиарда нуклеотидов[3], 3 миллиарда букв. Их надо где-то хранить, ими надо уметь манипулировать. Это чисто техническая сторона. Но очень важная.

Д.И.: А алфавит большой?

М.Г.: Четыре буквы. Впрочем, как всегда в биологии, оказывается, что есть еще немножечко букв.

Д.И.: Так и до нормального человеческого алфавита дорастем.

М.Г.: Это отдельная вещь. Но азбуку Морзе уже превзошли. Так вот, вторая вещь. Этими колоссальными объемами данных надо уметь манипулировать. Кроме того, оказалось, что можно делать утверждения уже не настолько частные, что «этот белок делает это», а строить утверждения о системе взаимодействия белков в клетке. Описания общих свойств на уровне целой клетки. Это постепенно перетекает в модную область, которая называется системной биологией с не очень понятным пока полем деятельности (она лишь формируется) - описание общих свойств взаимодействия. Это очень поучительно, потому что до некоторой степени преодолевается фасеточность. Тот эффект, когда вы смотрите только на части и неочевидно, что вы понимаете систему в целом. Стандартная байка про слона, которого ощупывают слепые.

Б.Д.: А как соотносится системная биология с обычной цитологией?

М.Г.: Цитология – фактически физиология клетки. Это описание чисто наблюдательное. А здесь вы больше говорите про механизмы. Например, замечательное упражнение - смотреть, какие гены работают на каких стадиях клеточного цикла. Стадия клеточного цикла – это понятие из цитологии, а какие гены включаются – из системной биологии. Пытаются моделировать, делать тотальные модели всего клеточного метаболизма, обмена веществ в клетке. Еще один аспект системной биологии, где тоже делаются проверяемые предсказания. Будете клетку кормить так – выход этанола будет таким, по-другому – другой. Это имеет важное народнохозяйственное значение.

Третий аспект биоинформатики, с моей точки зрения, самый интересный, потому что самая правильная биоинформатика – это биоинформатика эволюционная. Интереснее всего описывать не то, как клетка устроена сейчас, а то, как она такой получилась. Что происходило, что породило такие механизмы внутри клетки и т. д. Эволюционная биология - наука очень старая, а молекулярная эволюция, то есть использование молекулярных данных для реконструкции эволюционных событий, – вещь более новая. Она стала возможной, когда такие данные стали приходить в эволюционную биологию. Происходят, по-видимому, некие культурные войны между классическими эволюционными биологами и молекулярными эволюционистами. Причем они происходят в одну сторону. Люди, которые всю жизнь рисовали эволюционные деревья по морфологическим признакам[4], склонны недолюбливать молекулярных специалистов. Частично за дело, потому что первые молекулярные деревья были довольно наивными, а частично, по-видимому, по привычке. Сейчас молекулярные методы намного улучшились. Осознаны основные источники артефактов. Появились правила гигиены, которые позволяют этих артефактов либо избежать, либо хотя бы детектировать, чтобы было понятно, что надежно, а что сомнительно. А молекулярные эволюционисты к классическим всегда относились с очень большим почтением. И сейчас деревья, построенные по молекулярным данным, часто являются поводом для переосмысления каких-то изменений в морфологии. Это очень поучительно.

Кроме того, интересно задавать вопросы, которые люди раньше задавать не могли. Какова, например, эволюция тонких клеточных процессов. Вот самая красивая вещь, которая выросла в основном из молекулярных данных. Было доказано следующее. Есть митохондрии.[5] Они есть почти у всех живых существ, у которых есть ядро.

Д.И.: А у кого-то нет?

М.Г.: У бактерии нет ядра, и у архей. У некоторых существ с ядрами митохондрии тоже нет, хотя есть их остатки - они были, но потом пропали. Тоже, кстати, вещь, которая доказывается молекулярными методами. Так вот. Митохондрии – это то место, где происходит конверсия энергии и запасание энергии в клетках. Это, на самом деле, бывшие бактерии. В какой-то момент случился симбиоз двух клеток. Митохондрии (вернее, их предки) попали внутрь другой клетки. Это очень хорошо видно молекулярно. Была такая женщина - Маргулис, которая это предложила в качестве гипотезы. Гипотеза была довольно дикая, очень многие ее долго не принимали. А потом оказалось, что, если вы посмотрите на геном митохондрии, там явно видно, что это конкретный класс бактерий, то есть известно, кто их ближайшие родственники. И сейчас это вещь известная. Второй пример. Хлоропласты[6] - это тоже органеллы с собственной мембраной, в которой происходит фотосинтез, то есть процесс образования органического вещества из углекислого газа и воды на свету при участии фотосинтетических пигментов. Хлоропласты тоже известно кто - это потомки цианобактерий, которые раньше назывались сине-зелеными водорослями. И случилось такое событие - предок хлоропласта, который был цианобактерией, попал в предка растительной клетки.

Д.И.: А как они раньше питались, растения?

М.Г.: До того, как в них попал хлоропласт, они не были растениями. А кем инфузории питаются? Там есть разные промежуточные стадии.

Б.Д.: То есть это соединение позволило возникнуть растениям?

М.Г.: Сначала одноклеточным водорослям, а уже потом – растениям. Окончательное доказательство этого приходит потому, что вы определяете геном хлоропласта и видите, что больше всего он похож на геном цианобактерии. Это метод молекулярный и биоинформатический. Как только начинается сравнение последовательностей, это уже не разговор про эксперименты, а разговор про манипулирование символами.

Могу рассказать свою любимую историю. В клетках есть регуляторные системы - гены работают не все время, а включаются и выключаются в зависимости от условий среды и иных причин. Эти регуляторные системы изучают экспериментально. Изучают несколько основных модельных организмов, их не так уж много: кишечная палочка, дрожжи, дрозофила, мышь, морской еж. Эти регуляторные системы эволюционно страшно подвижны. То, как включается и выключается ген, даже в очень близких видах, может быть разным. Кстати, биологи, которые прочитали учебник, а то, что туда попало, основано на классических работах, сделанных на классических модельных организмах, это не очень хорошо осознают. Это вещь довольно фундаментальная. Регуляторные системы страшно пластичны.

Б.Д.: Более пластичны, чем геном?

М.Г.: У бактерий трудно судить. У них геном тоже пластичен. А у высших организмов, по-видимому, да. И это вещь тоже очень поучительная. Здесь можно надеяться на какой-то синтез классического палеонтологического понимания эволюции, которое проистекает из сравнительной анатомии, и того, что мы понимаем про молекулярные механизмы. Это очень здорово, потому что есть вещи, которые не очень хорошо объясняются с точки зрения классической эволюционной биологии. То есть объясняются на уровне махания руками.

Классический парадокс. Разные виды мушек-дрозофил очень друг на друга похожи. Но если вы посмотрите по времени, то увидите, что эти виды разошлись 70 миллионов лет назад - раньше, чем приматы и грызуны, но морфологически они почти не изменились. Цвет брюшка, щетинки немного другие. А приматы довольно сильно ушли от своего общего предка с грызунами. Скорее всего, источник таких значительных морфологических изменений – это изменение в регуляции генов на ранних стадиях эмбрионального развития. Я знаю один красивый пример, который легко объяснить. На бактериях я знаю много примеров, но они немного специальны. Но там мы можем реконструировать в деталях довольно глубоко то, как все и совсем меняется, а на высших организмах это делать труднее.

Хорошо прослеженных систем там намного меньше, но есть одна совершенно замечательная. Этим занимался Эрик Дэвидсон в Калтехе, который всю жизнь изучал регуляцию развития морского ежа. Это удобный экспериментальный объект – они хорошо живут и размножаются в аквариуме. Морские ежи – ближайшие родственники морских звезд. Если кто-то видел тех и других, то морской еж – такой шарик. Внутри у него органы, а снаружи – скелет и иголочки. Он движется за счет иголок, а скелет у него абсолютно жесткий. И он живет в основном внутри этого скелета. А морская звезда подвижная, изгибает щупальца. У них одинаковая пятилучевая симметрия. Биологи всю жизнь их считали ближайшими родственниками. Но непонятно, как случилось, что они такие разные. Выяснилась простая вещь. У морской звезды есть такой регуляторный механизм, который запускает развитие клеток. У морской звезды тоже есть маленькие иголочки. И у них есть площадка - такие пятнышки. Они отделены друг от друга, не мешают никакой гибкости.

Но есть замечательная наука – молекулярная эмбриология, - которая говорит, какие механизмы внутри клетки ее формируют, делают эту клетку той, в которую она превращается. Это зависит как раз от работы генов. Так вот, у морского ежа формирование тканей, из которых происходит внешний скелет, регулируется ровно тем же механизмом, что и у морской звезды. Но этот механизм включается существенно раньше. Поэтому этих клеток образуется больше, когда эмбрион делится. Если вы включаете этот механизм существенно раньше, образуется целая ткань вместо отдельных участков. При этом конкретные белки и гены, которые этот механизм образуют, те же самые.

А.К.: Помните анекдот про армянина, который поймал золотую рыбку? У него три желания. Он говорит: «Дом, семь комнат. Четыре из них полностью набиты долларами, неучтенными мелкими купюрами. В гараже внизу четыре машины. Две жены, одна про запас в другом доме, который я тоже заказываю – это раз». Это я к тому, что пока Михаил отвечал на вопрос: «Что же такое биоинформатика?»

Б.Д.: В одной из предыдущих передач мы с Михаилом разделили науку и технологию. Но эта часть науки явно начинает выходить и в сферу технологий, иметь какой-то народно-хозяйственный эффект. Можно об этом?

М.Г.: Давайте попробуем. Первый народно-хозяйственный эффект тот, что мы биологам рассказываем нечто для них существенное. Была конференция несколько лет назад. И какая-то девушка с какого-то радио долго выясняла, зачем нужна биоинформатика. Я пытался как-то объяснить, а она все говорила: «Не пойдет. У меня 30 секунд, а вы долго говорите». Под конец я озверел и сказал: «Биология нужна?» - «Нужна». - «Ну вот, и биоинформатика нужна для того же самого». Первое. Если мы считаем, что нужны биология, молекулярная биология, молекулярная генетика, медицинская генетика, то биоинформатика просто является орудием в руках тех, кто этим занимается.

Б.Д.: Что-нибудь удалось сделать?

М.Г.: Есть пример. Он не мой, но я знаю человека, который утверждает: он очень хорошо оптимизировал штаммы в одной большой биотехнологической компании, сказав, какие гены надо убить, а какие вставить, на основании анализа моделей метаболизма, о которых я говорил. Более естественный пример того, где будет расти роль биоинформатики. Это все, что связано с медицинской генетикой. Относительно простые вещи там уже сделаны. Болезни с простым способом наследования описаны. Дальше начинается целая наука про предрасположенности, про болезни, которые определяются сочетаниями вариантов генов или условиями. Например, ген, который говорит, что у вас будет рак, если вы курите. А если не курите, вы никогда об этом не узнаете.

Д.И.: Возможно такое утверждение?

М.Г.: Да. Система детоксикации вам нужна, если токсины в вас попадают. А если нет, какая вам разница, есть ли в вас система детоксикации.

Д.И.: То есть можно выявить людей, которым можно курить, а которым нельзя.

М.Г.: Есть вариант гена, который предрасполагает людей к отложению холестериновых бляшек. Если он у вас есть, лучше вам сала не есть. Это абсолютно конкретная вещь. И этого будет все больше и больше. Сейчас на Западе есть компании, которые устроены так. Вы им посылаете мазок со щеки. Они смотрят набор генов. А дальше они вам про вас рассказывают. Для начала они говорят, какой у вас цвет глаз. Это довольно надежно можно сделать, и это убеждает людей, что все остальное тоже правда. Кроме того, есть предрасположенности, которые можно пытаться описывать.

Б.Д.: И учитывать дальше.

М.Г.: Да. Это вещь очень тонкая. Например, вам говорят, что у вас риск диабета повышен вдвое. Это может означать все что угодно: от того, что надо идти и писать завещание, до того, что надо перестать есть сладкое - или что можно вообще ничего не менять, потому что это ничего не значит. Сама по себе вероятность маленькая. И когда она повышается в два раза, не очень понятно, случилось ли что-то.

Б.Д.: То есть к этим данным должен прилагаться специалист, который правильно их интерпретирует.

М.Г.: В хороших компаниях примерно так и делают. В США такое есть.

Б.Д.: У нас такое будет?

М.Г.: Будет, потому что это неминуемо. Будет ли это сделано хорошо? Не знаю. Но будет. На всякий случай должен сказать, что это не то, что называется "Гемокод". Есть такая компания, которая занимается... Поскольку у меня нет личного адвоката, я не скажу, как называется то, чем она на самом деле занимается. Просто название хорошее. Так вот - это не то. В России сейчас этого нет, но и сотовые телефоны не в России впервые появились.

Б.Д.: А еще что-нибудь? Связанное не с нами как людьми, а с технологиями, реализуемыми в экономике, с генной инженерией?

М.Г.: Когда биоинформатика вам сообщает: «Поменяйте таким образом геном и ваша бактерия станет делать в два раза больше того, чего вы от нее хотите», а потом приходит генный инженер и осуществляет генные изменения. А дальше - вы угадали или нет.

А.К.: Я все думаю про курение. Это ведь полностью меняет концепт. Получается, что все эти надписи на пачках про то, что «курение вредит вашему здоровью»...

Б.Д.: То, о чем говорил Михаил, связано не только с активным, но и с пассивным курением.

А.К.: Не важно. Надпись не универсальна, не корректна.

М.Г.: Ну, будет надпись: «Ваше курение вредит здоровью окружающих». Можно переформулировать.

Д.И.: Но ведь болезненные реакции могут быть не только на курение. Хоть на чай.

М.Г.: Не только. Очень многие болезни, по-видимому, являются следствием комбинации генетической предрасположенности и вредных факторов среды. Чем лучше мы это понимаем, тем лучше люди живут. Вторая замечательная вещь – это дифференциальный диагноз рака. Я всегда боюсь говорить про такие вещи, потому что потом звонят люди, у которых есть конкретные проблемы, а я говорю об общих вещах. Но тем не менее. Есть примеры лекарств, которые действуют на людей с очень конкретными молекулярными изменениями. То, что раньше мы сливали в одну болезнь, оказывается несколькими разными вариантами. И лекарство действует на одни и не действует на другие. Это устанавливается в том числе и с применением биоинформатических средств. Вы просто смотрите, какие гены работают. Это абсолютно практическая вещь. Людям с одинаковым морфологическим диагнозом нужно разное лечение в зависимости от молекулярных изменений в этих клетках. Установление этого факта возникло, в том числе, и с применением биоинформатических методов к массовым данным, с которых мы начинали.

А.К.: Время, к сожалению, подошло к концу. Мне кажется, что Михаил Сергеевич довольно подробно объяснил, чем занимается биоинформатика. Убедил, что это очень нужно. Напомню, что в студии были Анатолий Кузичев, Дмитрий Ицкович и Борис Долгин. Они задавали вопросы Михаилу Гельфанду, доктору биологических наук, профессору факультета биоинженерии и биоинформатики МГУ и, как мы вначале выразились, представителю цеха биоинформатиков. Спасибо и до встречи в эфире проекта «Наука 2.0».


[1] Рибосома – важнейшая органелла живой клетки. Служит для биосинтеза белка из аминокислот по заданной матрице на основе генетической информации. Перенос информации от ДНК осуществляется матричными РНК

[2] Аминокислоты – класс органических соединений, играющих очень большую роль в жизни организмов. Аминокислоты являются структурными единицами, из которых построены белки.

[3] Нуклеотиды – класс органических соединений, являющихся структурными единицами, из которых состоят полимерные цепочки нуклеиновых кислот в каждой клеточке всех организмов. Нуклеиновые кислоты, ДНК хранят, реализуют и передают наследственную информацию, записанную в виде последовательности нуклеотидов.

[4] Эволюционное дерево – представление эволюционных взаимосвязей между различными видами или другими сущностями, имеющими общего предка, в древовидной форме.

[5] Органеллы, содержащиеся в большинстве клеток, которые содержат ядро. В митохондриях производится аденозинтрифосфат – вещество, используемое в качестве основного источника химической энергии.

[6] Органелла в клетках многих растений и водорослей, в которой происходит процесс фотосинтеза с участием хлорофилла, зеленого пигмента, который обуславливает зеленую окраску у растений.

См. также:

Редакция

Электронная почта: polit@polit.ru
VK.com Twitter Telegram YouTube Яндекс.Дзен Одноклассники
Свидетельство о регистрации средства массовой информации
Эл. № 77-8425 от 1 декабря 2003 года. Выдано министерством
Российской Федерации по делам печати, телерадиовещания и
средств массовой информации. Выходит с 21 февраля 1998 года.
При любом использовании материалов веб-сайта ссылка на Полит.ру обязательна.
При перепечатке в Интернете обязательна гиперссылка polit.ru.
Все права защищены и охраняются законом.
© Полит.ру, 1998–2024.