Поможем написать учебную работу
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
Если у вас возникли сложности с курсовой, контрольной, дипломной, рефератом, отчетом по практике, научно-исследовательской и любой другой работой - мы готовы помочь.
От философии к биоинформатике
Андрей Шмаров: Что такое биоинформатика?
Виталий Сараев: В нашем геноме очень много букв, генов, когда его расшифровывают, получают огромное количество информации, в которой сложно разобраться. Часть этой информации бесполезна, она просто мусор, часть кодирует белки. Ученые, используя математические методы сравнения, сопоставления, вычленения, пытаются найти полезное и помочь расшифровать, что делают эти кусочки генома.
Михаил Гельфанд: Сначала биология была умозрительная. Есть байка: Аристотель написал, что у мухи четыре ноги, и так это с тех пор и переписывали. Вся наука на то время философия, и идти считать ноги было ниже их достоинства. Потом была зоология биология наблюдательная, когда Линней увидел микробов и попытался их систематизировать. Смотрели, но ни во что не вмешивались. Затем появилась биология экспериментальная, после которой мы завершили круг, и оказалось, что биологией опять можно заниматься умозрительно использовать знания, которые получают экспериментальные биологи, засовывать их в компьютер и методом расчленения делать из этого какие-то содержательные биологические выводы. Теперь о том, что происходило с геномом и с ДНК, с наследственностью. Это началось, с одной стороны, с Дарвина, который попытался описать механизмы изменения живых существ. Вторая сторона это Мендель с тем, что есть мельчайшие частицы наследственности. Если скрестить горох с зелеными семенами и желтыми, то в первом поколении весь горох будет одинаковый, а во втором будет четверть одних и треть других. Дарвину очень не хватало менделевских опытов. Потом началась генетика. Мы по-прежнему не знаем, что такое ген, и определяем его формально как минимальную единицу наследственности, но можем описывать, как гены работают. Открыли заново болезни, которые передаются по наследству.
Виталий Сараев: Открыли простейший алгоритм наследственности.
Михаил Гельфанд: Там была математика на уровне арифметики. Параллельно была химия, так как обнаружили, что в живых клетках есть нуклеиновые кислоты. В конце 1940-х годов доказали, что ДНК является носителем наследственности, потом определили структуру ДНК, и из нее стало сразу понятно, как генетическая информация передается в поколениях. Стало ясно, что гены это часть ДНК, которая кодирует белок, в начале 1960-х годов люди определили эти соответствия между последовательностью нуклеотидов в ДНК и последовательностью аминокислот в белкеТаблица генетического кода
Таблица генетического кода
Михаил Гельфанд: Георгий Гамов, физик, сказал, что должна быть какая-то система пересчета одной последовательности в другую. Последовательности белков закодированы в ДНК, и, значит, у вас должен быть код. В 1960-х годах возникло коллективное усилие по расшифровке этого кода разными методами, и все обменивались информацией практически свободно. Не было соперничества. И за несколько лет безумно тяжелая задача была решена. Теперь мы знаем таблицу генетического года, как пересчитывать ДНК в белок. В 1970-х годах придумали, как быстро определять последовательность нуклеотидов. После этого возникла идея, что раз данных много, то нужно с ними работать так, как принято работать с большими объемами данных. Пришли к тому, что можно пытаться смотреть последовательность нуклеотидов и пытаться делать из них биологические выводы. Возникла новая область. Уже не надо ничего копать, а можно смотреть на компьютере.
Андрей Шмаров: Исходя из того, что много уже накопали.
Михаил Гельфанд: Я начал информатикой заниматься после университета, и методов тогда не было никаких. Ты приходишь как на Средний Запад и говоришь: здесь будет моя ферма.
Виталий Сараев: Но свою ферму вы открывали не где-то, а на поле биологов.
Михаил Гельфанд: Сначала к этому относились с юмором. В это время развивалась идея, что можно, глядя на последовательность, восстанавливать историю. Но это как испорченный телефон, только где каждый говорит двум, а каждый из этих двух тоже говорит двум.
Андрей Шмаров: Эти первые два можно восстановить?
Михаил Гельфанд: В действительности такого нет, потому что мы не знаем, как было устроено ДНК динозавров, и, скорее всего, не узнаем. Но мы можем пытаться его реконструировать, глядя на современных потомков динозавров птиц, крокодилов, на их двоюродных родственников нас с вами.
Виталий Сараев: Это чистая математика?
Михаил Гельфанд: Там довольно хорошая математика. Нашу биоинформатику поначалу как-то терпели, относились к ней с юмором. Понятно, что данных очень много, и их надо засунуть в компьютер, и пусть будут люди, которые это умеют. Первый глубокий результат вылез из формального анализа последовательности примерно в 1993 году. К этому времени стало ясно, что данные надо держать в центральной базе данных. Все, что известно, мы положим в одно место и будем на всякий случай проверять. Потом возникла идея, что раз мы уже определили ген у человека, то, скорее всего, у шимпанзе будет точно такой же. Из всех таких соображений появилась центральная база данных, куда начали складывать последовательности генов, которые были определены. В 1993 году была опубликована статья про то, что есть вирусы, которые вызывают рак. Вирус саркомы птиц. И оказалось, что этот ген очень похож на нормальный клеточный ген. Два гена абсолютно разного происхождения один из нормальной клетки, другой из вируса, вызывающего рак. Один птичий, другой человечий.
Андрей Шмаров: И в чем суть?
Михаил Гельфанд: Они почти одинаковы. Это удивительно. Из этого возникла куча идей в онкологии. Что онкоген это испортившийся нормальный ген. До этого были умозрительные споры про природу рака: то ли это поломка нормальной клетки, то ли это инфекционная болезнь. А оказалось, что правы все. Это может быть вирусного происхождения, но те гены, которые в этом вирусе работают, это сбежавшие гены из нормальной клетки.
Андрей Шмаров: Вирус это не живая тварь?
Михаил Гельфанд: ДНК в белковой оболочке.
Виталий Сараев: Но в наших генах ведь куча остатков, которые туда встроили? Я слышал цифру порядка 56%.
Михаил Гельфанд: Это такой мусор с точки зрения сейчас живущего функционального организма.
Андрей Шмаров: Северинов нам рассказал про восстановленную бактерию LUCA.
Михаил Гельфанд: Этот геном, конечно, не восстановлен, никто не знает, какой был геном у последнего общего предка всех живых существ. Более того, совершенно не очевидно, что он был клеткой, он мог быть просто набором генов разных организмов. История довольно темная. Ядра у него не было. Важно понимать, что, когда он жил, была куча других живых существ. Выжили потомки только одного из них. Если вы будете смотреть историю отдельных генов, они сойдутся в разных этих предках. Потому что гены умеют переходить из генома в геном. Есть вертикальное наследование от предка к потомку, а есть горизонтальный перенос, когда далекие бактерии обмениваются кусками генома. Масштабы горизонтального переноса раньше сильно недооценивались. Эволюционное дерево каждого гена индивидуально. И у нас вместо хорошего дерева с веточками получается туманное, где гены с ветки на ветку прыгают. Вывод этого одного LUCA не было, а их было несколько. Из-за этого горизонтального переноса мы не можем достоверно реконструировать этапы эволюции. LUCA страшно модная история. Это первые осадочные породы, где можно проследить бактериальное происхождение. Но там нет хороших привязок. В таких хронологических реконструкциях древних времен много натяжек. Мы от биоинформатики ушли в интересные вещи, в эволюции и историю. Информатика же состоит, грубо, их трех вещей. Первая полезная биоинформатика.
Как биоинженерия может победить рак
Виталий Сараев: А народно-хозяйственный эффект это имеет?
Михаил Гельфанд: Безусловно. Это такая полезная биоинформатика для биологов, которая отвечает на содержательные биологические вопросы. У вас есть ген, кодирующий белок, у которого такая-то функция, включается он в таких-то условиях и не работает в других. Стандартные утверждения, которые, оказалось, мы можем делать не в эксперименте, а глядя на буквы и как-то их сопоставляя. Это и есть расшифровка. Мы начали массово получать тексты, а биоинформатика занимается тем, что пытается их читать. На этом как раз и был сломан скептицизм экспериментальных биологов. Я в одной лаборатории видел, как люди по клеточке проверяют нашу таблицу. Сказали, пока нормально.
Андрей Шмаров: Это первая биоинформатика, а какая вторая?
Михаил Гельфанд: Вторая пока совсем свежая. Это то, что называется «системная биология»
Взаимодействие белков
Михаил Гельфанд: Появились новые типы данных, когда вы смотрите на взаимодействия в клетке, как белки связываются друг с другом или с ДНК, как и на что они влияют.
Виталий Сараев: А у клетки есть какие-то свойства, не обусловленные суммой ее компонентов?
Михаил Гельфанд: Мы этого не знаем. До последнего времени у нас не было способа думать про это мы умели наблюдать клетку как целое, как она делится, в микроскоп видно, а молекулярные взаимодействия в клетке мы могли описывать только по одному.
Виталий Сараев: А насколько продвинулись? Хоть одну клетку полностью сумели описать на уровне молекулярных взаимодействий?
Михаил Гельфанд: Сейчас расскажу. Смотрите, это белки, а линии это их взаимодействия. И мы видим, какие белки взаимодействуют. Теперь мы можем делать какие-то выводы. Например, если белок взаимодействует с большим количеством других белков, то, скорее всего, мутация в этом гене будет очень вредной.
Андрей Шмаров: Почему она будет вредной? Мутация это разве то, что всегда вредно?
Михаил Гельфанд: Как правило да, большинство мутаций вредные. Потому что, если вы возьмете прибор и будете отверткой тыкать в произвольные места, скорее всего, вы его сожжете. Вы случайно можете что-то повернуть, и он станет лучше, но это бывает редко. Либо вредно, либо нейтрально. Мы видим исторически, что белок, который контактирует с большим количеством белков, медленно эволюционирует. Есть много важных аминокислот, которые по той же причине трогать нельзя.
Цикл развития малярийного плазмодия
Михаил Гельфанд: Это цикл развития малярийного плазмодия, у которого маленькая строчка это ген, красная это если ген работает, и зеленая если ген молчит. И это еще упорядочено по циклу развития. Тут видно, что гены циклично включаются и выключаются. И даже известно, какие функциональнее системы включаются и выключаются на разных стадиях.
Виталий Сараев: А что практически дает знание включения и выключения гена?
Михаил Гельфанд: Вы смотрите, какие гены работают или молчат в раке по сравнению с нормальной тканью, из которой этот рак произошел, вы видите, что происходит на молекулярном уровне, что происходит в раковой клетке и чем она отличается от здоровой. Оказывается, что раковые опухоли разного происхождения могут иметь одни и те же молекулярные поломки. Сначала рак классифицировали по месту: рак горла, рак желудка, где это случилось. Потом стали ставить диагнозы по происхождению: мелкоклеточный рак, рак саркомы. А потом стало возможно ставить диагнозы молекулярные. Оказалось что рак молочной железы это на самом деле несколько видов рака с совершенно разными молекулярными поломками. В одних и тех же клетках эти поломки случились, в одной и той же ткани, но молекулярный механизм разный из-за этого и способы лечения разные. Первый признак раковой опухоли клетки бесконтрольно делятся. Раньше, когда лечили, давили все клетки, которые быстро делятся. А современные лекарства от рака имеют четкую мишень действуют на конкретную молекулярную поломку, на конкретный белок. Но и у разных раков разного происхождения могут быть одни и те же молекулярные поломки. Если у вас есть лекарство, которое адаптировано, изобретено, сделано для одного вида рака, то оказывается, что его можно использовать в других раках, потому что молекулярный организм тот же самый, хотя локализация другая и происхождение другое. И это абсолютно практическая вещь. Я когда про рак говорю, не надо надеяться что завтра всех вылечат. Но это то, что начинают делать.
http://page42.ru/events/5696-matematiki-v-biologii.xl