Купить мерч «Эха»:

Александр Крайнов - Наука в фокусе - 2016-03-04

04.03.2016
Александр Крайнов - Наука в фокусе - 2016-03-04 Скачать

Н. Асадова

16 часов и 5 минут в Москве. У микрофона Наргиз Асадова и мой постоянный соведущий Егор Быковский, заведующий отделом науки журнала «Вокруг света». Привет, Егор. Здравствуйте, уважаемые радиослушатели.

Е. Быковский

Здравствуйте, дорогие друзья. Привет, Наргиз.

Н. Асадова

Да. Сегодня поговорим про роботов. И наверняка многие наши слушатели, люди, которые интересуются достижениями науки и техники, успели посмотреть ролик, где удивительный робот-гуманоид Атлас, ростом - как среднестатистический человек 175 см, весом 82 кг, легко и непринуждённо передвигается по пересечённой местности, открывает двери, поднимает ящики. И, в общем, на самом деле полное ощущение, что ходит человек.

Е. Быковский

Вполне осознанный.

Н. Асадова

И мы пригласили в студию сегодня Александра Крайнова, руководителя службы компьютерного зрения и нейросетевых технологий компании Яндекс. Здравствуйте, Александр.

А. Крайнов

Здравствуйте.

Н. Асадова

Здравствуйте. Чтобы обсудить, как это вообще возможно. Как это было возможно сделать, чтобы робот так хорошо ориентировался в пространстве, выполнял такие сложные задачи, как он упал и поднялся сам.

Е. Быковский

К мысли о роботах нас приучают целое столетие в фантастической литературе, и некоторое время уже не только фантастической. Но до сих пор не очень понятно, как это у них внутри происходит. Я сразу поясню, что когда мы говорим о роботах, мы говорим о программах – неважно, одеты они в какое-то металлическое… Главное, как они понимают мир вокруг себя, как они в нём ориентируются, как они принимают решения. Это очень любопытно.

Н. Асадова

Как вообще они функционируют. Расскажите нам, пожалуйста. Во-первых, ваши впечатления об этом Атласе.

А. Крайнов

Выглядит это, конечно, прекрасно. Я вообще снимаю шляпу, поклоняюсь перед той частью, которую я понимаю плохо, а именно перед механикой, насколько совершенно сделана эта машина – это, конечно, очень здорово. И для меня каждый раз загадка, куда же они спрятали батарейку, которая позволяет ему так долго эффективно двигаться. Ведь по идее это всё очень ресурсоёмко. И эта область мне…

Е. Быковский

Там нарезка такая была. Явно он всё-таки ходит не по часу, а по несколько минут.

А. Крайнов

Наверное. Но всё равно, тем не менее, это красиво смотрится. И правда здорово. И я тут восхищаюсь, как любой сторонний зритель, работой инженеров. Но также есть вторая часть, которая мне ближе и понятнее. Это его способность реагировать на какие-то внешние события, потому что ведь хорошо видно, что этот робот двигается не по какой-то заранее предопределённой программе и по строгому алгоритму действий, а он как-то реагирует на внешнюю среду, на внешние события.

Е. Быковский

Для тех, кто внимательно смотрел этот ролик, было видно, что когда он берёт ящик, допустим, там на боках нарисованы маркеры. Явно он на них ориентировался. Но вообще маркеров в лесу не было.

Н. Асадова

Да, по пересечённой местности, по лесу он ходил. Там всякие ямки.

Е. Быковский

С маркерами понятно, как действовать. Написана программа: прислони туда манипулятор, сожми и так далее. А если их нет?

А. Крайнов

Я не думаю, что маркеры играют такую ключевую роль. Я думаю, что когда-то они были нарисованы на этих ящиках и так остались, скорее всего. Если говорить о таких роботах, то у робота есть большое количество способов принимать информацию из окружающего мира. Это какие-то камеры, которые передают видеосигнал, и с помощью алгоритмов компьютерного зрения видеосигнал превращается в какие-то образы. И специальные датчики, которые указывают расстояние до объекта, многочисленные акселерометры, которые позволяют роботу понимать, что с ним происходит, как и куда двигаются части его тела и куда направлены векторы ускорения.

И я думаю, что таких датчиков там довольно много. И что касается решения задачи понимать, что происходит вокруг, такие задачи сейчас решаются более-менее успешно. Особенно действительно в том случае, когда нам нет смысла экономить на способах получения этого сигнала. Я абсолютно уверен, что там достаточное количество датчиков, стереокамер. И понимать, где находится дерево, а где ящик – это сейчас задача в общем случае более-менее решённая.

Н. Асадова

То есть часть, про которую вы говорите – это часть компьютерного зрения, да?

А. Крайнов

В том числе. Я думаю, что для человека зрение значит очень много. Наверное, процентов 70 информации мы получаем через зрение. Думаю, что для робота меньше, потому что он снабжён такими датчиками, которых у нас нету. То есть я думаю, что робот понимает расстояние до объекта благодаря не зрению, а просто каким-то иным способам. Есть такие датчики – лидары называются, которые позволяют это расстояние определять.

Е. Быковский

Эта задача кажется нам очень простой – отличить дерево от ящика. А вообще она, наверное, совсем не такая простая, как кажется. И даже, может быть, не от дерева, а как отличить ящик от пня.

А. Крайнов

Вообще – да. Задача довольно сложная. И ещё несколько лет назад её решать было крайне тяжело. И учёные хвастались друг перед другом достижениями, насколько уверенно они отличают кошку от собаки. Отличали не очень уверенно. Мы говорим об алгоритмах, которые создавались учёными. Но в последние годы ситуация довольно сильно поменялась. Потому что в компьютерном зрении появились они были давно. Но индустрия перевернулась благодаря тому, что нейронные сети, которые сейчас активно используются, которые известны нам годов с 1970-х, стали давать результат. Результат замечательный.

Если раньше нужно было… Как было раньше устроено компьютерное зрение? Человек методом пристального вглядывание в изображение решал, на что тут нужно смотреть, чтобы отличить одно от другого, какие-то кружочки, квадратики выделял. Если говорить чуть более научно – выделял градиенты либо какие-то способы, с помощью которых нужно выделять наиболее значимые области. И дальше на это всё натравливалось машинное обучение, которое каким-то образом училось распознавать объекты.

Сейчас ситуация поменялась. Сейчас машине дают примеры. И дальше она на этих примерах учится сама. Машина сама пытается распознать, найти способы отличать одно от другого.

Н. Асадова

То есть не человек задаёт, на что обратить внимание, чтобы отличить, а она сама…

А. Крайнов

Это очень похоже на то, как…

Е. Быковский

А критерии она вырабатывает сама?

Н. Асадова

Критерии вырабатывает сама.

А. Крайнов

Это очень похоже на то, как мы учим ребёнка. Как мы учим ребёнка отличать кубик от шарика? Мы же не говорим ребёнку: смотри, шарик – это такая круглая штука, а кубик с гранями. Мы говорим: вот шарик, а вот кубик. Дальше ребёнок уточняет полученные знания. Он показывает пальцем в картинку и спрашивает: это кубик? И, дождавшись положительного ответа, он дальше пройдёт 18 раз по всем членам семьи и удостоверится, что это кубик. И на протяжении какого-то периода своего взросления он так и делает: он ходит с книжкой с картинками и понимает, что это кошечка, это собачка. Примерно так же…

Е. Быковский

Натыкается на октаэдр и впадает в ступор.

А. Крайнов

Как-то так, да. Примерно так сейчас учат и машину. Ей дают большое количество примеров, на которых нейтронная сеть обучается сама. Она сама где-то в глубине себя вырабатывает признаки, как отличать одно от другого. Если вернуться к теме роботов, чем здесь интереснее история? Смотрите, с картинками мы же машине показываем какой-то набор картинок, который мы отобрали сами. И больше машине взять неоткуда. А когда робот учится ходить, это тоже ведь некое машинное обучение, он учится реагировать на какие-то внешние события, он может учиться сам. Он может, условно говоря, сам пробовать обойти препятствие с той или иной стороны, выставить свой шарнир в то или иное положение в зависимости от какого-то внешнего события и получать обратную связь – получилось или нет, упал или нет, продолжил движение или нет. И каждое внешнее событие, свою реакцию на него и последующий результат записываются где-то в памяти. И на этом робот учится. Он учится в следующий раз реагировать на событие лучше. Он учится тем самым методом проб и ошибок.

И если в случае компьютерного зрения мы довольно сильно ограничены теми размеченными изображениями, которые у нас есть, для того чтобы обучить, то в такой задаче, когда робот обучается ходить, фактически ограничений нет. Человек просто выпускает его в окружающую среду.

Е. Быковский

Если я правильно следовал за вашей мыслью, то мы берём некий полигон, допустим, большая комната с препятствиями, обучаем там робота, он превосходно её изучает в конце концов, может двигаться как угодно. Но тут мы выпускаем его в среду, где ему всё незнакомо. Он должен снова на каждом метре площади учиться же заново. Он не может взять и начать двигаться.

А. Крайнов

Фактически да. Потому что когда мы выпускаем робота из комнаты, мы выпускаем в окружающий мир робота, который обучен двигаться по ровной поверхности. И, конечно, когда ему начинают встречаться препятствия, которых он доселе не видел, какие-то горки, какие-то ветки или ещё что-то, первое время его навыки оказываются непригодными. Он начинает падать, он не может ходить. Но он же учится. И каждый раз учёные, усложняя перед ним задачу, тренируют его всё больше и больше.

Н. Асадова

На самом деле у людей же то же самое: если взять мотогонки или автогонки, каждый раз, когда вы приезжаете на новую трассу, какой бы вы крутой водитель не были, хоть вы Михаэль Шумахер, вы должны проехать и изучить новую трассу. Иначе вы не выиграете.

А. Крайнов

Да. И в мире машинного обучения есть такой термин – дообучение. То есть алгоритм учится реагировать на какие-то события, мы добавляем туда новых событий и дообучаем наш алгоритм, вводим какие-то новые сложные факторы, которые алгоритм должен учитывать при выборе оптимального решения.

Е. Быковский

Давайте отвлечёмся от Атласа и я спрошу про обработку изображений.

Н. Асадова

Вот эта часть компьютерного зрения, которая касается анализа.

Е. Быковский

Вы, насколько я понимаю, этим и занимаетесь в Яндексе. Что вы можете интересного рассказать про какие-то прорывы в обработке изображений? Я вижу, что у Google, что у вас, что у каких-то других крупных игроков сильные подвижки произошли за последнее время в распознавании, допустим, похожих изображений или что-то ещё любопытное. Как это всё происходит?

А. Крайнов

Это как раз примерно то, о чём я говорил. О том, что поменялся способ машинного обучения. Если раньше то, что мы обучали – мы подбирали какие-то факторы и дальше на них тренировали некую формулу, что давало результат, но очень медленно и тяжело, то сейчас во всём мире ситуация поменялась. И сейчас используются так называемые глубокие нейронные сети. Это нейронные сети, состоящие из большого количества слоёв. В каждом слое есть маленькие нейроны, которые по своей сути являются небольшой формулой, которая принимает решение. И когда нейронная сеть обучается, она подбирает эти формулы таким образом, чтобы принимать правильные решения. И это даёт поразительные результаты. Скорость разработки возросла несоизмеримо по сравнению с тем, что было раньше.

Если раньше похожие изображения, которые искали мы и другие компании, выглядели примерно так, что мы находим что-то более-менее в том же цвете и геометрически то же самое, то сейчас нейронная сеть, которую обучали распознавать объекты, ¬когда ищет похожие изображения, ищет изображения, близкие по семантике. То есть если мы в поисковую систему загружаем какую-то картинку зимнего леса и говорим «найди нам такие же», она находит картинки зимнего леса. Они могут быть отличны по цвету, по геометрии, по чему угодно, но они такие же по смыслу. Когда нейронную сеть обучали искать похожие изображения, обучали классифицировать, отличать объекты одни от других, она научилась видеть объекты примерно так же, как это делаем мы. То есть то, что для нейронной сети является похожим, является похожим и для нас.

Это, конечно, не всегда так. Потому что нейронную сеть, обученную на произвольном наборе изображений, тяжело заставлять искать изображения знакомых людей так же, как их ищем мы. То есть с точки зрения любой нейронной сети… Когда мы загружаем в поиск по изображению лицо какого-то человека, которого знаем только мы, нашего близкого знакомого, искренне полагаем, что она его сейчас везде и найдёт. А для нейронной сети это сделать предельно тяжело, потому что человек более-менее похож на всех остальных людей.

Н. Асадова

Мы все на одно лицо для неё.

А. Крайнов

Не то что прямо до такой степени, но близко к тому.

Е. Быковский

Для китайцев мы все…

А. Крайнов

Здесь я бы сказал так, что примерно похожая история для нас. Если нам показать фотографию некого человека, которого мы раньше не видели, и предложить его найти, для нас решить эту задачу будет крайне тяжело. А когда мы даём в качестве входа фотографию знакомого нам человека, то мы искренне ожидаем увидеть ровно такой же результат. И вот здесь, конечно, компьютеру тяжело.

А в случае, когда нам нужно распознавать автомобили или находить каких-то животных, или это связано с распознаванием текста на изображении, что у нас очень много где используется – в переводчике, в поиске изображений, которые пользователи на диск загружают, вот здесь компьютер решает задачи очень легко.

Е. Быковский

Животных, конечно, проще. У них изменчивость меньше, чем у людей.

А. Крайнов

Есть и задача, когда изменчивость высокая. Например, одежда. Это очень тяжёлая задача для компьютерного зрения. Это очень нежёсткий объект. Если мы сфотографировали рубашку один раз, в следующий раз она будет выглядеть совсем по-другому. Сейчас есть способы искать предоставленную одежду. Это очень много где используется, в многочисленных коммерческих системах. У нас на Яндекс.Маркете используется. Если есть какая-то выбранная одежда, в рекомендациях внизу можно увидеть похожий визуально ряд одежды.

Н. Асадова

Вы говорите про то, что глубокая нейронная сеть действует. А как её создают? Это что такое? Когда мы говорим про нейронную сеть, мы представляем себе нейроны мозга, как такие клетки.

Е. Быковский

Да, после массы передач по биологии. Вы понимаете, что там происходит, или это чёрный ящик в некотором смысле?

А. Крайнов

И да, и нет.

Н. Асадова

Расскажите, как там устроено.

А. Крайнов

Расскажу. Современная нейронная сеть состоит из трёх очень важных китов. Архитектура – это тот самый набор формул, последовательностей, как они выполнятся и всё остальное. Куда вложен человеческий разум в наибольшей степени. Следующее – это огромное количество железа, то есть аппаратного обеспечения, которое позволяет всю эту сложную программу выполнять и тренировать. И третий кит – это большое количество данных, которые размечены, на основе которых может учиться сеть. «Вот это кубик, а вот это шарик», - как мы учим ребёнка.

А дальше происходит следующее. Нейронная сеть инициализируется случайными параметрами. То есть у нас есть какой-то набор многочисленных формул, которые более-менее случайны. И результат, если нам нужно отличать кубики от шариков, подаётся примерно случайной нейронной сетью. Но что происходит дальше? Дальше в каждом слове каждый конкретный нейрон начинает меняться. Начинает меняться формула, которая входит в его состав. Или какие-то элементы этой формулы. И нейронная сеть смотрит: в результате этого изменения стала она лучше отличать шарики от кубиков? У неё есть какая-то размеченная коллекция, то, как она определила, соответствует размеченной коллекции или нет. И когда этот результат начинает чуть-чуть сдвигаться в лучшую сторону от случайного, то, где изменение помогло сдвинуться, фиксируется. И начинает меняться следующий элемент. Этот процесс называется «обучение нейронной сети». Он может длиться очень долго. Иногда он занимает месяцы. Но в результате мы получаем то, что называется «обученная модель». Мы получаем такое состояние нейронной сети, в которой каждый нейрон – это некая формула, и значения этой формулы зафиксированы. И мы можем очень быстро рассчитывать результат для каждого входного изображения: что это – шарик или кубик? Кошка или собака? Красивая фотография или не очень? Тот человек, которого мы искали, или не он?

И современные нейронные сети состоят из огромного количества слоёв. Каждый слой состоит из большого количества нейронов. Как это выглядит? У нас есть нейрон первого слоя. И у нас есть первый слой, каждый нейрон которого смотрит на свой кусочек изображения и решает, относится к нему этот кусочек изображения или нет, должен ли он зажигаться, как лампочка, или нет.

Нейроны следующего слоя смотрят уже не на изображение, а на нейроны предыдущего… На реакцию. И каждый нейрон решает для себя: если зажглась третья, восьмая и двадцать четвёртая лампочка, значит это ко мне. Я должен зажечь. Нейроны следующего слоя уже смотрят на нейроны предыдущего. Но я так рассказываю примитивно. Если вы меня не остановите, я сейчас буду продолжать ещё минут 18. А слоёв у нас в нейронной сети много.

Н. Асадова

По поводу нейронных связей я не помню точную цифру, может, Егор, ты мне поможешь: сколько нейронных связей у человека?

Е. Быковский

Никто тебе этого не скажет.

Н. Асадова

Там какое-то количество миллиардов.

Е. Быковский

Сотни миллиардов.

Н. Асадова

Да, сотни миллиардов. Если взять самый современный, самый крутой обученный компьютер с нейронными связями, созданный на сегодняшний момент, насколько он уступает…

Е. Быковский

Ты про связи спросила? Нет, связей гораздо больше, потому что, во-первых, в мозгу есть миллиарды нейронов. И от каждого синапса отходит до тысячи связей. То есть триллионы и триллионы.

Н. Асадова

Мой вопрос такой. Когда человечество создаст машину с такой нейронной сетью, которая могла бы сравниться с человеческим мозгом?

Е. Быковский

Тут, наверное, не проблема напихать триллион нейронов. Ну как, проблема. Но она решается технически. Наверное, проблема в другом.

Н. Асадова

Я думаю, в связях.

А. Крайнов

Проблем много. Проблемы в том, что я говорил, что качество растёт от количества размеченных данных. Нужно где-то эти данные собрать. Но даже если предположить, что их собрали, чем больше данных, тем тяжелее учиться. Тем больше и больше вычислительных ресурсов нужно. Если говорить в терминах несколько популистских, когда машина в принципе превзойдёт человека, не знаю, может, и никогда. Надеюсь, никогда. Не при нас точно. Но другое дело, что сейчас всё чаще и чаще случаются ситуации, когда машина начинает превосходить человека в решении некой конкретной задачи. И всё меньше и меньше остаётся таких конкретных задач, в которых мы можем похвастаться, что человек обыгрывает компьютер. Есть такая прекрасная древняя настольная игра го, которая оставалась единственной, в которой человек уверенно выигрывал компьютеры. Тут был недавно матч, где программа «AlphaGo» победила европейского чемпиона. Но европейский чемпион сильно отличается от азиатских. Через несколько дней будет матч с Ли Седолем – такой азиатский чемпион, игрок девятого профессионального дана в го. И это прямо в мире такое событие, все его с нетерпением ждут, что будет. Падёт этот бастион или нет.

Это программа, написанная таким коллективом, называется «Deep Mind», сейчас он принадлежит компании Google. Это учёные, которые как раз разрабатывают технологии глубоких нейронных сетей. Их все разрабатывают. И команда «Deep Mind» в том числе.

Е. Быковский

Тогда интересно, как это действует – эвристическим способом, или просто перебором вариантов? В шахматах это перебор.

А. Крайнов

Здесь очень красиво. Мне очень нравится об этом рассказывать, потому что там действительно алгоритмы работают исключительно красиво. И всё, что есть замечательного в нейронных сетях, представлено. Есть три последовательные части. В первой части, так как количество вариантов огромно, и в отличие от шахмат, их нельзя просчитать даже на сколько-либо значительную глубину, нейронная сеть обучена предсказывать лучший ход. Она обучилась на партиях лучших игроков, и она просто глядя на позицию интуитивно, примерно так же как этот человек, выбирает лучший ход. Дальше есть алгоритм перебора, расчёта. Расчёт в игре го очень тяжело сделать до конца, да и невозможно, прямо скажем. Идёт расчёт до какой-то позиции. И следующая нейронная сеть обучена предсказывать по этой позиции, выигрышна она или проигрышна. И в результате компьютер играет так, что он делает некое предсказание лучшего хода, просчитывает его вперёд, смотрит, чем закончился расчёт какой позиции, и решает, лучше это стало или нет. Довольно похоже на то, как играет человек. Но самое интересное в этом то, что, как и в случае с роботами, которые ходят, здесь есть такой способ обучения, который называется reinforcement learning. Здесь компьютер учится не на том, что мы ему сказали, а здесь компьютер учится в том числе и на тех ситуациях, которые он сам для себя создал. Компьютер может играть и играет партии сам с собой и учится на результатах партий сам с собой.

Н. Асадова

Значит в два раза быстрее.

А. Крайнов

Да, да. Начальное его обучение было создано на партиях людей. А дальше, когда он набрал какой-то уровень мастерства, он стал учиться на играх сам с собой. Примерно так же происходит и с человеком. Если предложить человеку научиться чему-нибудь с самого нуля, не помогая ему совсем никак, обучение будет очень долгим. Но когда человек достигает вершин мастерства, то дальше он способен прогрессировать самостоятельно и без помощи тренера. То же самое происходит в ситуациях, когда компьютер может сам для себя создавать ситуации, решать их и получать обратную связь от результатов решения – что в игре го, что в роботах, которые ходят.

Е. Быковский

А вы говорите – батарейки. В таких роботов даже как-то страшно вставлять батарейки. Надо сохранять у них кабель, чтобы можно было их выдернуть от питания.

А. Крайнов

Тут есть одно принципиальное отличие человека от робота, которое нас ещё долго будет спасать. Роботы не занимаются целеполаганием. Они всё-таки пока решают те задачи, которые ставит перед ними человек. И до тех пор, пока это так, мы можем довольно безбоязненно оставлять у них хорошие батарейки.

Н. Асадова

А разве не бывает роботов, которые сами перед собой должны ставить задачи, в зависимости от изменённых условий?

Е. Быковский

Это локальные задачи.

Н. Асадова

Например, роевые роботы, роевые системы, которые на других планетах призваны работать.

Е. Быковский

Им всегда задача обозначена. Они её решают, исходя из среды.

Н. Асадова

И условий, да.

Е. Быковский

Но когда они исполнят, что они будут дальше делать? Мы заслали, допустим, куда-нибудь на Европу. Он исследовал всё. Что ему дальше делать? Тут в его совокупной голове может зародиться мысль «кто я?» и «зачем я?». Но как это произойдёт, я не знаю.

Н. Асадова

Есть такая опасность, Александр? Скажите нам честно.

А. Крайнов

Я вам могу гарантировать за компанию «Яндекс», что мы нашим алгоритмам искусственного интеллекта никогда не дадим задачу заменить людей. Надеюсь, что коллеги из компании «Boston dynamics», которые делают роботов, будут поступать так же. Пока в любом случае человек много сильнее.

Н. Асадова

Это звучит очень воодушевляюще.

Е. Быковский

Если не забывать о том, что «Boston dymanics» - вообще-то военная компания. И то, для чего они делают этих роботов, это цели довольно грустные.

Н. Асадова

Да, в общем-то. Тем не менее, Александр в начале передачи сказал, что, скорее всего, тот прекрасный ролик, который мы видели, нарезан из удачных моментов, а там было гораздо больше неудачных, скорее всего.

Е. Быковский

Были миллионы неудачных.

Н. Асадова

Но мы их не увидели. Они остались за кадром.

А. Крайнов

Я думаю, что с течением времени доля удачных моментов будет, безусловно, расти. И через какое-то время ребятам из компании «Boston Dymanics» будет тяжело собрать нарезку из неудачных моментов.

Е. Быковский

Ой-ой-ой.

Н. Асадова

Ой-ой-ой. На этой… (какой ноте?) тревожной ноте мы заканчиваем первую часть нашей передачи.

Е. Быковский

Эмоциональной.

Н. Асадова

И благодарим Александра Крайнова, руководителя службы компьютерного зрения и нейросетевых технологий компании «Яндекс» за то, что был сегодня с нами в студии и объяснил нам, как всё это работает. Сейчас прервёмся на новости и рекламу, затем вернёмся в эту студию. Никуда не уходите.

НОВОСТИ

Н. Асадова: 16

35 в Москве. У микрофона по-прежнему Наргиз Асадова и Егор Быковский, заведующий отделом науки журнала «Вокруг света». И сейчас мы поговорим про биоту.

Е. Быковский

Скорее, про микробиом. Мы пару раз затрагивали эту тему. Говорили о проекте «Микробиом человека». И поэтому мне ужасно понравилась новость, которая недавно была опубликована в журнале «BMC Bioinformatics» о том, что группа российских учёных, среди которых были и сотрудники московских институтов физико-химической медицины и физико-технического института, они предложили новый метод сравнения метагеномов – совокупностей и последовательностей ДНК всех организмов в образце исследуемого биологического материала. Этот метод позволяет сильно эффективнее быстро решать задачу сравнения образцов и может быть внедрён в процесс анализа данных в любом метагеномном исследовании.

Это очень интересно. А почему именно это интересно, мы решили поговорить об этом с нашим гостем по телефону.

Н. Асадова

Да, с Александром… старшим научным сотрудником лаборатории биоинформатики Федерального научно-клинического центра физико-химической медицины. Александр, здравствуйте. Вы нас слышите?

А. Тяхт

Здравствуйте.

Е. Быковский

Здравствуйте, Александр. Давайте начнём, как говорили римляне, от яйца. Просто скажите для начала пару слов о том, что есть объект исследования метагеномики и чем именно вы занимаетесь. Метод изучения чего вы улучшили?

Н. Асадова

Создали.

А. Тяхт

В нашем центре мы занимаемся молекулярно-генетическими исследованиями микробиоты. Это сложные микробные сообщества из среды. И наиболее интересным для нас и с точки зрения биомедицины полезным является микробиота кишечника человека. В ней столько же клеток, сколько и клеток у самого человека. А генов вообще на два порядка больше. И это бактериальное сообщество, которое живёт внутри нас, играет огромную роль в поддержании здоровья человека с самого рождения.

Е. Быковский

Простите. Я сразу просто уточню. Мне казалось, что их, возможно, даже больше по количеству клеток, чем человеческих клеток. Просто они мельче.

А. Тяхт

Да. Последнее время действительно считалось так. Но буквально несколько месяцев назад была опубликована статья, где учёные серьёзно пересмотрели эти цифры. И оказалось, что на самом деле эффект был несколько преувеличен. Речь идёт о том, что примерно столько же клеток.

В любом случае это сообщество действительно важно для нас. Его фигурально называют последним открытым органом человека, потому что оно регулирует множество всевозможных функций от пищеварительных, иммунных до других, вплоть до высшей нервной деятельности.

Интересным образом оказалось, что более половины микробных видов, которые обитают внутри человека, не поддаются культивированию традиционными методами. То есть с помощью посева мы их никогда не увидим. И здесь на сцену выходят современные молекулярно-генетические методы, в том числе секвенирование метагеномной ДНК. Путём прочтения фрагментов геномных текстов бактерий оно позволяет нам выяснить структуру и функции этого микробного сообщества - что за виды у нас обитают и чем они там занимаются, какие гены у них есть, перевариванием… веществ и так далее. Соответственно, в результате метагеномного секвенирования получаются данные. Их много. Это Big Data. Они называются «риды» от слова «прочтение». Прочтения бактериальных метагеномов – это подобно обрывкам текста из рассказа в книге. И потом, восстанавливая из обрывков полный текст, вы можете понять, о чём повествование, то есть что за бактерии у нас есть и чем они занимаются.

Н. Асадова

А каковы критерии воссоздания этого текста? То есть они как-то разработаны?

А. Тяхт

Да. В течение последних лет было разработано много биоинформатических алгоритмов. Для этого здесь были привлечены как имеющиеся тексты из теории машинного обучения и распознавания образов и так далее, так и разработаны новые алгоритмы. И наиболее традиционный подход к анализу метагеномных данных заключается в сравнении с базой данных известных последовательностей бактериальных геномов, полученных в случае исследования отдельных «ридов», изолированных на чашке, например. И здесь мы понимаем, что один метагеномный «рид» от одной бактерии пришёл, другой – от другой. Мы при определнии состава метагенома, при проведении классификации таким образом наносим обрывки текста на похожие места в сборнике рассказов, и так понимаем, о чём история. Чем больше «ридов» от какой-то бактерии мы наблюдаем, тем больше данного вида в составе сообщества. И так можно судить о процентах относительной представленности таксонов в образце. И потом, сделав так для множества различных образцов, можно сравнивать полученные составы по какой-то метрике. Например, один образец микробиоты сообщества в одном человеке близок к другому, к другому – менее.

Е. Быковский

То есть вы сравниваете наборы ДНК из микробиота здорового человека и больного, и получаете при этом результат, который позволит довести его микробиоту до нормального состояния. Да?

А. Тяхт

Да, действительно. К настоящему моменту проведено очень много ассоциативных исследований состава микробиота при различных заболеваниях. И здесь на самом деле причинно-следственная связь сложная. То есть, с одной стороны, микробиота может быть плохой, условно говоря, и из-за этого вызывать риск каких-то заболеваний.

С другой стороны, обратно, само заболевание может привести к ухудшению, дисбалансу кишечного сообщества. Но в значительной мере сейчас исследования нацелены на то, чтобы можно было в духе персонализованной медицины определять для конкретного пациента, насколько его бактериальное сообщество близко или отдалено от ненормальных разбалансированных сообществ, наблюдаемых при ряде заболеваний, и исходя из меры сходства оценивать потенциальный вклад микробиоты в риск развития данного заболевания для конкретного человека.

Е. Быковский

Вообще вы сейчас употребили любопытное слово «норма». Что такое норма для микробиоты? Насколько я понимаю, достаточно сложно её установить, особенно для жителей совсем разных областей. И наборы микроорганизмов не то что совсем разные, но существенно отличающиеся.

Н. Асадова

Например, корейцы с удовольствием едят что-нибудь очень острое. Если я съем такую пищу, я умру на следующий день, мне кажется.

А. Тяхт

Да, это интересный вопрос. Он нас как исследователей интригует. Фактически каждый день мы об этом тоже думаем, задаём себе этот вопрос, чтобы не обманывать самих себя. И действительно не существует эталонной нормы. Она действительно может варьироваться. Состав микробиоты может значительно меняться у здорового населения стран мира. Но стоит отметить, что для нас, как и для аналитиков данных, выборка до сих пор не слишком велика. Просто сами исследования достаточно дорогостоящие по сравнению с традиционными видами анализов. Поэтому ожидается, что накопление больших баз данных, по которым мы сейчас наблюдаем сейчас стремительный рост. И в ближайшие годы мы сможем иметь действительно обоснованные и достоверные данные об общем ландшафте нормы. Действительно она может широко варьироваться. Но при этом стоит отменить, что в то время как разные виды могут формировать костяк сообщества, их функции на уровне относительной представленности генов более-менее пребывают в постоянстве, что говорит о так называемом функциональном гомеостазе. Микробы могут варьироваться, но их функции, их сумма, метаболический реактор работает…

Е. Быковский

Биохимия одна и та же у нас примерно.

Н. Асадова

Да. Александр, мне ещё интересно. Вы сказали, что большие данные о микробиотах разных людей, разных популяций собираются. А как они собираются? Это какие-то дорогостоящие тоже исследования? То есть у тебя кровь берут. Как это выглядит?

Е. Быковский

Добровольцы?

Н. Асадова

Да, добровольцы? Сколько их сейчас в мире участвует. Или это просто какие-то лабораторные исследования, когда у населения просто собирают обычные анализы и куда-то отправляют. Как это выглядит?

А. Тяхт

Да, действительно, к настоящему моменту про геном много широкомасштабных проектов. Есть консорциумы, например, «Human microbiom project» (HMP) – проект по микробиоте человека в США. В Европе совместно с Китаем – это проект MetaHIT, где производились заборы метагеномов. То есть образцы кала у здорового населения собирались. И впоследствии выделялась ДНК, проводилась подготовка и метагеномное секвенирование… Аналогичным образом в течение нескольких последних лет состоялся российский метагеномный проект, в ходе которого была описана норма микробиоты кишечника у населения сёл и городов Российской Федерации.

Н. Асадова

А сколько примерно человек участвует во всех этих консорциумах, во всех этих исследованиях? То есть какова выборка?

А. Тяхт

Пока что невелика, к сожалению. Речь идёт о сотнях образцов. И когда люди отправляются в экспедиции, там тоже порядка несколько десятков-сотен у изолированных популяций удаётся собрать этих образцов. Однако мы надеемся, что в ближайшее время технологии будут дешеветь, становиться всё более распространённой. И можно будет перейти на уровень вычислительной статистики, когда речь будет о тысячах. А в дальнейшем это станет доступным каждому, как мы надеемся.

Н. Асадова

Наверное, последний вопрос. То исследование, которое вы провели, оно как-то может помочь человеку справиться с какими-то болезнями, которые у него есть, связанные с микробиотой?

А. Тяхт

Да. Здесь есть открытие небольшое, которое мы сделали. На самом деле основные принципы подхода применялись и ранее. Но не для сложных микробных сообществ, а для отдельных геномов. Метод основан на разбиении метагеномных «ридов» на короткие слова – k-меры. Например, если слово «микробиота» разбить на шестимеры, это будет «микроб», «икроби», «кробио», «обиото», «биотой». Так мы поступаем с метагеномными данными одного образца и потом анализируем спектр частот этих k-меров в образце. На основании этого оцениваем попарное сходство между метагеномами от людей, в том числе самых здоровых и больных.

И оказалось, что наш метод более чувствителен к неизвестным компонентам по сравнению с традиционными методами, основанными на сравнении с… базой. И, в частности, позволяет, идентифицировать такие малоисследованные компоненты, как виром – вирусы, которые также детектируются в метагеномных данных, но обычно отсутствуют в каталогах бактериальных геномах, которые используются в традиционных методах. И действительно мы проанализировали имеющиеся данные и идентифицировали значительную представленность одного недавно открытого вируса кишечных микробов. Он называется… был открыт в 2014 году. И мы считаем, что это биомедицински важно, потому что вирусы и бактерии регулируют вообще бактериальное сообщество.

Н. Асадова

Всё понятно. Александр, спасибо вам большое. К сожалению, время вышло. Сейчас мы прервёмся на пару минут рекламы, затем вернёмся.

Е. Быковский

Спасибо.


Напишите нам
echo@echofm.online
Купить мерч «Эха»:

Боитесь пропустить интересное? Подпишитесь на рассылку «Эха»

Это еженедельный дайджест ключевых материалов сайта

© Radio Echo GmbH, 2024