микробиома что это такое
Наш микробиом – это отдельный орган?
Примечание Лахта Клиники.
Пробиотик – пищевой продукт или пищевая добавка, несущая в себе живую культуру бактерий-симбионтов, присутствие которых в толстом кишечнике критически необходимо человеческому организму.
Пребиотик – волокнистая органическая (преимущественно растительная) пища, которая не расщепляется и не перерабатывается собственными ферментами пищеварительной системы человека, но служит важнейшим ресурсом для кишечной симбиотической микробиоты.
Микробиом, микробиота –принятые в современной медицине собирательные термины, обозначающие всю совокупную популяцию микроорганизмов, существующих в каких-либо пределах (в данном случае имеется в виду толстый кишечник человека). Устаревший и ныне вытесняемый из употребления синоним – микрофлора.
Данная статья представляет собой экстракт нашего общения с двумя врачами-исследователями из Великобритании, специализирующимися в области ожирения и нарушений метаболизма: доктором Петрой Хансон и доктором Томасом М. Барбером. Темой обсуждения выступали микробиом, маркетинговый хайп вокруг пробиотиков и возможные направления будущих исследований. П.Хансон и Т.Барбер работают в медицинском институте и университетском больничном комплексе «Ковентри и Уорикшир» (фонд Национальной службы здравоохранения Великобритании). Оба являются членами Уорикской Сети по борьбе с ожирением.
Внимательно изучив сегодня полки многих аптек и магазинов, можно убедиться в том, что увлечение пробиотиками и спрос на них ничуть не ослабевают, рынок отвечает массой предложений, и все это уже давно не ограничивается одними лишь йогуртами. Пробиотики входят в десятки добавок. Они есть в шампунях, зубных пастах, средствах ухода за кожей, сухих завтраках для людей и кормах для домашних животных. Они присутствуют даже в некоторых гипоаллергенных матрацах.
Шумиха вокруг пробиотиков проистекает от растущего научно-исследовательского внимания и признания важности кишечного микробиома, – совокупности обитающих в толстом кишечнике бактерий.
Исследователи кишечного микробиома изучают его потенциал в плане бесчисленных положительных эффектов и влияний как на физическое, так и на психическое здоровье. Этот потенциал вдохновляет искать здесь новые перспективные подходы к укреплению здоровья, – и, возможно, к профилактике эпидемии ожирений, – посредством оздоровления наших кишечных бактериальных культур. Результаты исследований таковы, что специалисты из Университета Уорика считают возможным и необходимым рассматривать кишечный микробиом почти как полноправный орган.
Действительно: как и прочие органы, кишечный микробиом может вызвать серьезное недомогание и плохое самочувствие, если мы не будем заботиться о нем должным образом. И напротив: за ним закреплена власть способствовать укреплению здоровья и улучшению самочувствия, если бактерии культивируются правильно.
«Мы знаем, что симбиотический по отношению к человеческому организму микробиом критически важен для оздоровлении физиологических процессов. Как показывают наши исследования, он выполняет множество различных функций, – например, участвует в нормальном развитии иммунной системы, в медиации воспалительных путей и метаболических процессов, в регуляции аппетита и так далее».
Доктор Петра Хансон
Недавнее масштабное и высококачественное, в плане организации, исследование, результаты которого опубликованы в авторитетном журнале Nature Medicine, позволило задокументировать ранее неизвестные или недооцениваемые связи между состоянием здоровья и кишечным микробиомом, проследив существенное влияние определенных бактериальных культур на благоприятные и нездоровые исходы.
С жизнедеятельностью некоторых видов бактерий, по всей видимости, тесно связаны плохой аппетит, недостаточная масса тела и сниженный общий воспалительный статус. Недавняя работа специалистов Уорикского медицинского института показала, что другие бактериальные культуры ассоциированы с неблагоприятным состоянием обменных процессов. Более того, есть публикации (журнал Nature), где изучается связь определенных паттернов микробиома с более здоровым старением.
На сегодняшний день мы идентифицировали лишь около 1000 микроорганизмов в человеческом теле, хотя предполагаем, что на самом деле их миллионы.
К тому моменту, когда ребенок достигает трехлетнего возраста, кишечная микробиота в норме окончательно формируется и стабилизируется, однако мы знаем, что различные факторы могут изменить ее разнообразие и развитие. Сюда относятся, прежде всего, генетические факторы, диета, возраст, способ рождения, антибиотики, пробиотики, пребиотики, фекальные трансплантаты.
«До настоящего времени исследования с участием людей-добровольцев носили преимущественно наблюдательный характер. У нас по-прежнему недостаточно доказательств того, что более здоровый, более разнообразный микробиом обеспечивает более здоровый метаболизм; мы пока можем утверждать лишь то, что такие микробиомы связаны с лучшими показателями. Это совсем другой стандарт».
В условиях все более интенсивного научного поиска и растущего со стороны потребителей интереса маркетологи успешно продают массу продуктов, манипулируя непроверенными и никем не доказанными обещаниями. Чтобы преодолеть хаос рекламных заявлений и трезво проанализировать эти предложения, мы должны отличать словесные кружева от фактов. Здесь мы в своих суждениях опираемся на последние научные данные.
Пробиотики
Ученые полагают (PubMed Central, наукометрическая база данных Национальных институтов здравоохранения США), что пробиотики действуют как стабилизаторы баланса в составе кишечной микробиоты, тем самым поддерживая эффективность иммунной системы. Итоги недавно завершенного исследования свидетельствуют о том, что некоторые типы пробиотиков могут положительно влиять на течение определенных заболеваний.
Однако нельзя не уточнить: невзирая на огромную популярность пробиотиков в последние годы, доказательства их полезных эффектов и безопасности (включая возможные побочные эффекты) остаются недостаточными.
Фекальные трансплантаты
Согласно научным данным, доступным в базе PubMed Central, проводились детальные исследования возможных преимуществ все чаще применяемого подхода, который подразумевает трансплантацию фекальных бактерий от здорового донора пациентам, страдающим кишечными заболеваниями, – в качестве попытки восстановить функционирование здоровой кишечной микробиоты. Имеются аргументированные сообщения о том, что такие трансплантаты могут способствовать исцелению или быть средством выбора при различных заболеваниях, в т.ч. при воспалениях кишечника разной этиологии, синдроме раздраженного кишечника, запорах (констипации), метаболических расстройствах, аутоиммунных заболеваниях, аллергии, синдроме хронической усталости и т.д.
Фекальная трансплантация значительно более эффективна, чем пробиотики, – эффект трансплантированной микробиоты сказывается примерно до 24 недель, тогда как пробиотики действуют лишь на протяжении 14 дней.
Пребиотики
Пища растительного происхождения является источником пребиотиков (Wiley, рецензируемый журнал), – веществ, стимулирующих рост кишечных бактерий. Согласно имеющимся данным, пребиотики обладают тремя главными отличительными свойствами:
— сопротивляются всасыванию через кишечные стенки;
— микробиом может ферментировать их;
— могут иметь позитивный эффект для здоровья посредством как прямого, так и косвенного действия на микробиом.
Волокнистая клетчатка, входящая преимущественно в продукты растительного происхождения, является основным источником пребиотиков. Различают два типа пищевой клетчатки: растворимая (способствует снижению уровней холестерола и глюкозы), и нерастворимая (стимулирует кинетику пищеварительной системы)
В свою очередь, главным источником растворимой клетчатки являются фрукты и овощи. Нерастворимой клетчаткой особенно богаты злаковые и цельнозерновые культуры, однако большинство продуктов, где много клетчатки как таковой, несет в себе оба ее типа.
Ныне действующие рекомендации в отношении потребления волокнистой клетчатки взрослыми в большинстве европейских стран и Соединенных штатах составляют 30-35 граммов в день для мужчин и 25-32 г/день для женщин, но в ежедневном рационе большинства людей клетчатки меньше.
Одно из исследований специалистов из Уорика было посвящено этому пробелу. Выяснилось, что большинству из нас следовало бы увеличить повседневное потребление клетчатки примерно вдвое.
Исследования продолжаются. Предстоит найти ответы на множество вопросов – о сложных взаимодействиях кишечника и центральной нервной системы, о роли микробиома в регуляции метаболизма, иммунитета, настроения, общего физического и психического самочувствия и т.д. А пока сформулируем основную идею для широкой публики.
Ешьте побольше растительной волокнистой клетчатки. Ешьте фрукты и овощи. Ешьте разнообразную, желательно не обработанную химией пищу. Ваш бактериальный внутренний орган способен творить чудеса для вас, если относиться к нему с пониманием и заботой.
Микробиом человека: особенности использования данных секвенирования из открытых источников
Михаил Никитин, Наталья Захаревич, Алексей Ковтун, Ирена Артамонова
«Природа» №11, 2020
Об авторах
Михаил Сергеевич Никитин — аспирант Института общей генетики имени Н. И. Вавилова РАН (ИОГен РАН) и Физтех-школы биологической и медицинской физики Московского физико-технического института (национального исследовательского университета). Область научных интересов — биоинформатика и эволюционная геномика.
Наталья Владимировна Захаревич — кандидат биологических наук, старший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН. Область научных интересов — молекулярная генетика, биоинформатика, бактериальные серин-треониновые протеинкиназы, бифидобактерии, анализ микробных сообществ, в том числе кишечной микробиоты человека.
Алексей Сергеевич Ковтун — младший научный сотрудник лаборатории генетики микроорганизмов ИОГен РАН. Область научных интересов — биоинформатика, метагеномный анализ, микробиота кишечника человека, ось кишечник — мозг.
Ирена Игоревна Артамонова — кандидат биологических наук, старший научный сотрудник, руководитель группы биоинформатики отдела вычислительной системной биологии ИОГен РАН, старший научный сотрудник Института проблем передачи информации имени А. А. Харкевича РАН. Область научных интересов — биоинформатика, молекулярная эволюция, CRISPR-Cas системы прокариотического иммунитета, микробиом человека, геном человека.
До недавнего времени большинство геномных исследований было направлено на виды микроорганизмов, поддающиеся культивированию в лабораторных условиях, хотя их количество составляет лишь малую часть от всего существующего многообразия. Сейчас большой интерес представляет одновременный анализ генетического материала всех организмов, обитающих в определенной среде, — метагеном. Объектами метагеномных исследований служат самые разные экологические сообщества — совокупности микроорганизмов, живущих в почве [1], закрытых полостях океанических гейзеров [2] и т.д.
В фундаментальной медицине значительное внимание уделяется исследованиям микробиома человека, поскольку сообщество микроорганизмов, которые населяют наше тело на взаимовыгодных условиях (симбиоза), участвует во множестве важных функций — пищеварительной, регуляторной, защитной и т.д. * Некоторые исследователи даже рассматривают микробиом человека как один из его органов [3], при этом по суммарному количеству генов и общей длине метагеном этого сообщества превышает ДНК человека на несколько порядков [4].
Видовой состав микроорганизмов в разных полых органах (желудке, кишечнике, мочевом пузыре и т.д.) человека неодинаков. Так как эти органы не изолированы, состав их микробиома может меняться, но не скачком, а по непрерывному градиенту [5]. Мы сосредоточимся на микробиоме кишечника, так как считается, что он, во-первых, самый разнообразный по видовому составу [6] и, во-вторых, именно он оказывает наибольшее влияние на здоровье человека. Например, была установлена взаимосвязь между составом микробиома кишечника и секрецией гормона стресса [7], расстройствами аутистического спектра [8, 9], болезнями Альцгеймера [10] и Паркинсона [11] и т.д. Нет ничего удивительного в том, что исследованию именно этого подмножества полного человеческого микробиома посвящено такое большое число активно финансируемых проектов (и международных, и национальных), и к настоящему времени уже получен огромный массив данных, значительная часть которых находится в открытом доступе.
NGS и первичная обработка полученных данных
Открытием, позволившим метагеномике появиться и успешно существовать наряду с классическими исследованиями культивируемых микроорганизмов, стало развитие методов секвенирования (от англ. sequence — ‘последовательность’) нового поколения (next-generation sequencing, NGS). Буквально за несколько лет они резко увеличили производительность секвенаторов и уменьшили стоимость анализов на несколько порядков, причем с каждым днем они становятся не только дешевле, но и качественнее. Сейчас полногеномный «сиквенс» (результат секвенирования) микробиомных проб с качеством, достаточным для информативного исследования, уже доступен отдельным лабораториям при условии привлечения основных средств большого гранта. Однако для большинства небольших научных групп цена такого исследования пока довольно высока, и именно поэтому столь привлекательна идея использовать массив данных, уже полученных мировым сообществом в этом направлении.
Здесь пришло время кратко пояснить основные этапы современного процесса секвенирования и определить некоторые необходимые для дальнейшего изложения термины. Секвенирование метагеномов методами NGS происходит в следующей последовательности. Сначала из концентрата исходной пробы, взятой из исследуемой среды, выделяется тотальная ДНК и фрагментируется на относительно короткие участки, нуклеотидные последовательности которых «прочитываются» секвенатором. Затем с помощью вычислительных методов (в случае метагеномов методов сборки de novo, т.е. без опоры на какую-либо заранее известную, референтную, геномную последовательность) короткие последовательности собираются в контиги (от англ. contiguous — ‘непрерывный’) — более длинные непрерывно прочитанные участки геномов отдельных организмов, составляющих исходное сообщество. Короткие последовательности — непосредственный результат секвенирования — называют ридами (англ. read — ‘чтение’). Все риды в процессе одного «сиквенса» имеют, как правило, одинаковую длину, которая зависит от используемой модели секвенатора и часто вносит основной вклад в качество полученных контигов. Кроме непосредственно нуклеотидной последовательности секвенатор выдает и количественную оценку качества для каждого прочитанного нуклеотида, которая часто критически зависит от положения нуклеотида внутри читаемого фрагмента и уменьшается к концу рида.
Стандартный протокол обработки данных, полученных с секвенатора, заключается в следующем:
Масштабные исследования микробиома кишечника с открытым доступом к данным
Перечислим лишь наиболее репрезентативные проекты по секвенированию микробиома кишечника. Многие из них сопровождаются параметрическими характеристиками доноров проб.
Эпоха метагеномных исследований микробиома человека началась с двух глобальных проектов, инициированных почти одновременно в Европе и США. Эти проекты и по сей день остаются самыми масштабными в этом направлении. Европейский проект — «Метагеном кишечника человека» (Metagenome of Human Intestinal Tract, MetaHIT) — объединил усилия ученых из 15 институтов восьми стран. MetaHIT нацелен на построение каталога генов микробиома кишечника человека, а также разработку инструментов для анализа наличия и частоты появления выбранных генов у разных групп людей. Основные исследования проекта были проведены на двух различных группах доноров проб. Первая группа включала более 300 датчан из ранее организованной когорты Inter-99 [16]. Все доноры не имели заболеваний желудочно-кишечного тракта (ЖКТ) и не принимали антибиотики в течение полугода до сдачи проб. В состав второй группы вошли 39 испытуемых из Испании, часть которых страдала воспалительными болезнями ЖКТ в стадии клинической ремиссии, а остальных использовали в качестве контроля [17, 18]. Данные секвенирования обеих групп доступны в базе Европейского института биоинформатики (European Bioinformatics Institute, EBI), номера записей ERA000116 и ERP003612, соответственно. Секвенирование было произведено на платформе Illumina Genome Analyzer. Данные имеют длину ридов в 44, 75 и 90 нуклеотидов, в зависимости от группы и конкретного образца. Кроме того, для индивидуальных проб из первой группы до недавнего времени были доступны авторские сборки на сайте Европейской молекулярно-биологической лаборатории (The European Molecular Biology Laboratory, EMBL), но сейчас в открытом доступе они отсутствуют.
Американский проект «Микробиом человека» (Human Microbiome Project, HMP) с самого начала преследовал более глобальные цели исследования микробиомов различных органов человеческого тела. В качестве испытуемых были выбраны 300 человек в возрасте 18–40 лет без хронических заболеваний [5]. Для разных органов доступны образцы как 16S-, так и полногеномного секвенирования. В частности, данные о полногеномном секвенировании кишечного микробиома представляют собой 136 образцов. Риды доступны для скачивания с портала проекта, а характеристики доноров могут быть предоставлены по дополнительному запросу на сайте Национального центра биотехнологической информации США (National Center for Biotechnology Information, NCBI). Секвенирование метагенома кишечника проводилось на платформе Illumina MiSeq, и в результате были получены риды длиной в 95 нуклеотидов.
В открытом доступе также находятся данные нескольких более поздних национальных исследований микробиома человека. Одно из них посвящено изучению особенностей микробного состава кишечника здоровых японцев в сравнении с жителями других стран [19]. В качестве испытуемых выбрали 106 здоровых человек из Японии, видовой состав их микробиома сравнивали с таковым из других исследований в Америке, Европе и Китае. Благодаря тому, что секвенирование проводилось сразу на нескольких платформах — 454 GS FLX Titanium и FLX+ (Roche), Ion PGM и Ion Proton (Life Technologies), а также MiSeq (Illumina), были получены риды нескольких типов. Процессированные риды, после фильтрации по качеству, удаления адаптеров и картирования на геном человека, можно найти в Японской базе данных ДНК (DNA Data Bank of Japan, DDBJ) под номером PRJDB3601. Фенотипические данные испытуемых доступны в приложении исследования. Дополнительно, от некоторых индивидуумов пробы брались многократно с интервалом в несколько недель. Анализ этих данных сильно затрудняет использование многих платформ секвенирования в очень разных комбинациях для разных индивидуальных проб. Не все из индивидуальных множеств ридов проходят сравнение с общепринятыми сейчас порогами по качеству. Перечисленные свойства сильно ограничивают применимость этих данных в независимых исследованиях, поэтому мы отказались от их использования.
Другим примером использования микробиомных данных в национальных исследованиях можно считать эксперимент по сравнению видового состава микробиома жителей городской и сельской местности в России [20]. В исследовании приняло участие 96 человек (50 горожан и 46 сельских жителей) из восьми регионов России, не имеющих хронических заболеваний. Секвенирование проводилось на платформе SOLiD 4, в результате были получены риды длиной 50 нуклеотидов. Данные секвенирования размещены в Архиве последовательностей ридов (Sequence Read Archive, SRA) NCBI под номером SRA059011. В сравнении с остальными исследованиями, полученные риды имеют слишком короткую длину, что также затрудняет их независимое использование.
Последнее из национальных исследований, которое мы хотим здесь упомянуть, принципиально отличается от предыдущих, так как не предполагает общей характеристики здоровой микробиоты; его цель — сравнительное описание микрофлоры кишечника людей с диагностированным диабетом второго типа, а также поиск различных характерных маркеров для данного заболевания [21]. В этой работе проанализированы пробы от 368 доноров из Китая, 183 из которых были больны диабетом, а остальные вошли в контрольную группу. Секвенирование проведено на платформах Illumina GAIIx и HiSeq 2000 в две стадии, с итоговой длиной ридов в 75 нуклеотидов на первой стадии и 90 — на второй. Данные испытуемых также размещены в открытом доступе в NCBI SRA под номерами SRA045646 и SRA050230.
Качество данных
Секвенирование во всех перечисленных исследованиях сделано на различных приборах и достаточно давно. Напомним, что приборы и протоколы секвенирования нового поколения сейчас меняются очень быстро и качество прочитанных ридов растет. Соответственно, довольно быстро устаревают и стандарты, принятые в этой области. Качество данных из прошлых проектов становится критичным для использования в текущей работе.
В индивидуальных образцах последнего из перечисленных исследований, проведенного для диабета второго типа, риды обеих длин имеют приемлемое для сборки качество: оно выше порога после стадии фильтрации, в результате которой отбраковывается 10–20% ридов. После их удаления риды индивидуальных проб этого проекта готовы для сборки.
Риды из первых масштабных проектов значительно худшего качества: некоторые пробы из проекта MetaHIT не проходят формального сравнения с порогами по качеству ни до, ни после фильтрации ридов, несмотря на то, что их качество после этого значительно улучшается. Кроме того, для всех проб характерна слишком существенная потеря объема в результате фильтрации: количество ридов в индивидуальных множествах уменьшается на 30–90%. По нашему опыту, такая потеря информативности критична для сравнения параметров индивидуальных микробиомов. Если же задача не предполагает сборки индивидуальных метагеномов для каждого донора, а нацелена на описание общего разнообразия кишечной микрофлоры человека, то эти данные все еще пригодны для использования единым массивом (например, [22]). А для сравнения индивидуальных проб мы предлагаем изменить стандартный протокол обработки ридов (об этом см. следующий раздел).
Риды HMP оказались очень плохого качества при первой проверке до стандартного процессинга. Но в данном случае проблема кроется не в качестве прочтения отдельных нуклеотидов, а в большом количестве ридов, полностью или частично состоящих из непрочитанных нуклеотидов, обозначенных буквой N. После стандартного процессинга с помощью программы Trimmomatic (с включенной опцией фильтрации по «N» среди прочих) проблема решается. Общее количество отфильтрованных ридов достаточно высоко — для разных проб оно доходит до 50%, но 35–38% из них составляют риды, полностью состоящие из непрочитанных нуклеотидов (обозначенных буквами N) и изначально не несущие информации. В результате, с учетом достаточно большого размера индивидуальных множеств прочтений (до 25 млн ридов для каждой индивидуальной пробы, что приблизительно в два раза больше характерной пробы для проекта MetaHIT) и приличной длиной рида, этого вполне достаточно для информативной сборки хорошего качества.
Сравнение сборок для ридов плохого качества
Часто используемый протокол обработки данных секвенирования, повторим, предполагает укорачивание или удаление ридов плохого качества. Однако стадия фильтрации по качеству может быть заменена на стадию коррекции. Такой подход сильно ограничен по двум причинам: во-первых, для коррекции ридов нет достаточного количества эффективных программ (таких, например, как Quake [23]), а во-вторых, нет возможности оценить качество скорректированных ридов и сравнить его с качеством исходных.
В случае работы с общедоступными данными по микробиому человека для коррекции ридов удобно использовать программу BayesHammer, встроенную в MetaSPADes. Она была разработана для исправления ридов в протоколе одноклеточного секвенирования, но и для обычного секвенирования геномов, в том числе метагеномов, она оказалась высокоэффективной [24]. Выяснилось, что для данных проекта MetaHIT использование программы BayesHammer в процессе сборки программой MetaSPADes без стадии фильтрации по качеству, но с предварительным удалением адаптеров и ридов, картированных на геном человека, дает достаточно качественные сборки без потери основной доли информации в индивидуальных пробах.
Проиллюстрируем это на пяти случайно выбранных индивидуальных микробиомах из проекта MetaHIT. Для удобства сравнения мы выбрали все пять проб из подмножества с длиной ридов 75 нуклеотидов. Применение протокола к индивидуальным пробам с другой длиной ридов (44 или 90 нуклеотидов) дает аналогичный результат.
Для каждого индивидуального микробиома мы проанализировали все собранные контиги не короче 200 нуклеотидов, полученные в результате запуска программы MetaSPADes на множествах ридов до и после стадии фильтрации по качеству, с использованием одинаковых параметров программы. Для сравнения сборок мы выбрали суммарную длину всех контигов и параметр N50, чаще других используемый для оценки качества сборки. Для его определения нужно упорядочить все контиги по длине от большего к меньшему и суммировать их длину до достижения половины общей длины сборки — N50 равен длине текущего контига (результаты сравнения см. в табл. 1).
Таблица 1. Сравнение параметров сборок для пяти образцов из проекта MetaHIT
Помимо общих параметров полученные сборки целесообразно сравнить с известными геномами микроорганизмов. Для этого мы использовали выравнивание сборок, полученных до и после фильтрации, с последовательностями из нуклеотидного раздела базы данных GenBank [25] с помощью пакета программ BLAST [26]. Доли выравниваемых участков микробиома варьировали от пробы к пробе, но не различались существенно между сборками до и после фильтрации.
Сравнение сборок для ридов хорошего качества
Для иллюстрации протокола, использованного при анализе данных проекта MetaHIT, приведем результаты его применения к данным проекта HMP. Аналогично программе Trimmomatic, MetaSPADes тоже фильтрует исходные данные от ридов, полностью состоящих из букв N, на начальной стадии. Для сравнения были использованы три образца проекта HMP и параметры, использованные в предыдущем аналогичном сопоставлении (результаты см. в табл. 2). В данном случае описанный протокол несколько уступает стандартному по качеству и общей длине сборок.
Таблица 2. Сравнение параметров сборок для трех образцов из проекта HMP
В пробах HMP в среднем выявлена значительно более высокая доля ридов, сходных с известными геномами микроорганизмов, чем в пробах проекта MetaHIT. В этом случае индивидуальные сборки до и после фильтрации тоже не различаются существенно по доле таких ридов.
Среднее качество ридов значительно влияет на качество последующей сборки. При использовании стандартного протокола наряду с удалением адаптеров и ридов, заведомо не относящихся к исследуемым организмам, фильтрация ридов по качеству может слишком сильно сократить объем полученной при секвенировании информации. В такой ситуации изменение протокола обработки ридов с заменой фильтрации на коррекцию может существенно исправить положение.
При работе с доступными микробиомными данными такой подход позволил сохранить большую часть данных в индивидуальных пробах проекта MetaHIT и получить надежные результаты в описании практически важных индивидуальных характеристик микробиома. Но в случае более качественного секвенирования в проекте HMP такой подход оказался излишним — результаты его применения немного хуже, чем для стандартного протокола.
Таким образом, работа с микробиомом человека или любыми другими метагеномными данными, полученными в независимых исследованиях, требует тщательного контроля качества данных на разных этапах анализа. И, при выполнении этого условия, работа становится весьма продуктивной для получения нетривиальных выводов о структуре и индивидуальных характеристиках метагеномных проб.
Работа выполнена при поддержке Российского фонда фундаментальных исследований (проект 18-29-07087).
Литература
1. Daniel R. The metagenomics of soil // Nat. Rev. Microbiol. 2005; 3(6): 470–478. DOI:10.1038/nrmicro1160.
2. Sunagawa S., Coelho L. P., Chaffron S. et al. Structure and function of the global ocean microbiome // Science. 2015; 348(6237): 1261359. DOI:10.1126/science.1261359.
3. Baquero F., Nombela C. The microbiome as a human organ // CMI. 2012; 18: 2–4. DOI:10.1111/j.1469-0691.2012.03916.x.
4. Gill S. R., Pop M., Deboy R. et al. Metagenomic analysis of the human distal gut microbiome // Science. 2006; 312(5778): 1355–1359. DOI:10.1126/science.1124234.
5. Turnbaugh P. J., Ley R. E., Hamady M. et al. The human microbiome project // Nature. 2007; 449(7164): 804–810. DOI:10.1038/nature06244.
6. Lozupone C. A., Stombaugh J. I., Gordon J. I. et al. Diversity, stability and resilience of the human gut microbiota // Nature. 2012; 489(7415): 220–230. DOI:10.1038/nature11550.
7. Dinan T. G., Cryan J. F. Regulation of the stress response by the gut microbiota: implications for psychoneuroendocrinology // Psychoneuroendocrinology. 2012; 37(9): 1369–1378. DOI:10.1016/j.psyneuen.2012.03.007
8. Mulle J. G., Sharp W. G., Cubells J. F. The gut microbiome: a new frontier in autism research // Curr. Psychiatry Rep. 2013; 15(2): 337. DOI:10.1007/s11920-012-0337-0.
9. Averina O. V., Kovtun A. S., Polyakova S. I. et al. The bacterial neurometabolic signature of the gut microbiota of young children with autism spectrum disorders // J. Med. Microbiol. 2020; 69(4): 558–571. DOI:10.1099/jmm.0.001178.
10. Vogt N. M., Kerby R. L., Dill-McFarland K. A. et al. Gut microbiome alterations in Alzheimer’s disease // Sci. Rep. 2017; 7(1): 13537. DOI:10.1038/s41598-017-13601-y.
11. Scheperjans F., Aho V., Pereira P. A. et al. Gut microbiota are related to Parkinson’s disease and clinical phenotype // Mov Disord. 2015; 30(3): 350–358. DOI:10.1002/mds.26069.
12. Andrews S. et al. FastQC: a quality control tool for high throughput sequence data. 2010.
13. Bolger A. M., Lohse M., Usadel B. Trimmomatic: a flexible trimmer for Illumina sequence data // Bioinformatics. 2014; 30(15): 2114–2120. DOI:10.1093/bioinformatics/btu170.
14. Langmead B., Trapnell C., Pop M. et al. Ultrafast and memory-efficient alignment of short DNA sequences to the human genome // Genome biol. 2009; 10(3): R25. DOI:10.1186/gb-2009-10-3-r25.
15. Nurk S., Meleshko D., Korobeynikov A., Pevzner P. A. metaSPAdes: a new versatile metagenomic assembler // Genome Res. 2017; 27(5): 824–834. DOI:10.1101/gr.213959.116.
16. Glümer C., Jørgensen T., Borch-Johnsen K. Prevalences of diabetes and impaired glucose regulation in a Danish population: the Inter99 study // Diabetes care. 2003; 26(8): 2335–2340. DOI:10.2337/diacare.26.8.2335.
17. Qin J., Li R., Raes J. et al. A human gut microbial gene catalogue established by metagenomic sequencing // Nature. 2010; 464(7285): 59–65. DOI:10.1038/nature08821.
18. Le Chatelier E., Nielsen T., Qin J. et al. Richness of human gut microbiome correlates with metabolic markers // Nature. 2013; 500(7464): 541–546. DOI:10.1038/nature12506.
19. Nishijima S., Suda W., Oshima K. et al. The gut microbiome of healthy Japanese and its microbial and functional uniqueness // DNA Research. 2016; 23(2): 125–133. DOI:10.1093/dnares/dsw002.
20. Tyakht A. V., Kostryukova E., Popenko A. et al. Human gut microbiota community structures in urban and rural populations in Russia // Nat. commun. 2013; 4: 2469. DOI:10.1038/ncomms3469.
21. Qin J., Li Y., Cai Z. et al. A metagenome-wide association study of gut microbiota in type 2 diabetes // Nature. 2012; 490(7418): 55–60. DOI:10.1038/nature11450.
22. Karlsson F. H., Nookaew I., Nielsen J. Metagenomic data utilization and analysis (MEDUSA) and construction of a global gut microbial gene catalogue // PLoS Comput Biol. 2014; 10(7): e1003706. DOI:10.1371/journal.pcbi.1003706.
23. Kelley D. R., Schatz M. C., Salzberg S. L. Quake: quality-aware detection and correction of sequencing errors // Genome biol. 2010; 11(11): R116. DOI:10.1186/gb-2010-11-11-r116.
24. Nikolenko S. I., Korobeynikov A. I., Alekseyev M. A. BayesHammer: Bayesian clustering for error correction in single-cell sequencing // BMC genomics. 2013; 14(Suppl 1): S7. DOI:10.1186/1471-2164-14-S1-S7.
25. Benson D. A., Cavanaugh M., Clark K. et al. GenBank // Nucleic Acids Res. 2013; 41(Database issue): D36–D42. DOI:10.1093/nar/gks1195.
26. Altschul S. F., Madden T. L., Schäffer A. A. et al. Gapped BLAST and PSI-BLAST: a new generation of protein database search programs // Nucleic Acids Res. 1997; 25(17): 3389–3402. DOI:10.1093/nar/25.17.3389.
* Подробнее о роли микробиома в жизни человека см. публикации А. Н. Суворова в «Природе»: Полезные микробы — кто они? (2009. №7. С. 21–30); Микробиота человека и косметология (2010. №8. С. 22–25); Гонки с микробами: наши шансы (2011. №5. С. 13–24); Микробиота детей (2011. №8. С. 14–21); Мир микробов и человек (2015. №5. С. 11–19); Микробиота пожилых: истоки долголетия (2017. №1. С. 22–29); О нас и наших онколитических бактериях (2018. №8. С. 3–9); Давайте целоваться, это не только приятно (2019. №4. С. 54–57). — Примеч. ред.