Дополнительно о распространении тюркской генетики

20.11.2017

Предлагаю вашему вниманию статью Кергуду-фон-гудю.

Ну что ты будешь делать с нежелающими читать самостоятельно?

Как обычно проводятся исследования? Вы полагаете, что один раз взяв образцы у той или иной группы населения, исследовав их и накатав научный труд, опубликовав его, всё тут-же выкидывается, кроме книжек?

Ан нет. Образцы древесины, скажем, после дендроанализа хранятся и постепенно накапливаются целые древохранилища. То же самое происходит и с другими вещдоками, например, образцами для генетических исследований. Особенно, для масштабных. Ибо сбор образцов - дело довольно трудоёмкое и затратное. А потому, для нового исследования используется часть уже имеющихся образцов (либо обработанных данных), а часть образцов собирается с нуля (в зависимости от цели исследования).

Увидев пару строчек текста, как можно делать такие глобальные выводы?

Из научной статьи:

Генетическое наследие экспансии тюркоязычных кочевников по Евразии

Извлечение (или резюме) - первое, что мы можем увидеть в статье, кроме авторов.

Тюркские народы представляют собой разнообразный набор этнических групп, определяемых тюркскими языками. Эти группы рассеялись по обширной территории, включая Сибирь, Северо-Западный Китай, Центральную Азию, Восточную Европу, Кавказ, Анатолию, Ближний Восток и Афганистан. Происхождение и история раннего расселения тюркских народов оспаривается, причем кандидаты на свою древнюю родину простираются от Закаспийской степи до Маньчжурии в Северо-Восточной Азии. Предыдущие генетические исследования не выявили четкого унифицирующего генетического сигнала для тюркских народов, который предоставляет поддержку для замены языка, а не демографическую диффузию как модель для расширения тюркского языка. Мы обратились к генетическому происхождению 373 особей из 22 тюркоязычных популяций, представляющих их нынешний географический ареал, путем анализа данных генотипа с высокой плотностью генома. В соответствии с моделью языковой экспансии элитарного доминирования большинство изучаемых тюркских народов генетически напоминают своих географических соседей. Тем не менее, западнотюркские народы, отобранные по Западной Евразии, имели избыток длинных хромосомных путей, идентичных по происхождению (ВБД), с населением из современной Южной Сибири и Монголии (ССМ), область, где историки сосредотачивают ряд ранне-тюркские и - тюркские степные народы. Хотя в популяциях, не относящихся к тюркским языкам, наблюдаются ССМ, соответствующие трассам IBD (> 1 сМ), в тюркских народах этот процент выше (на уровне 0.01) выше, чем у их не тюркских соседей. Наконец, мы использовали метод ALDER и предполагали даты примесей (~ IX-XVII вв.), Которые пересекаются с тюркскими миграциями V-XVI вв. Таким образом, наши результаты указывают на историческую примесь среди тюркских народов, а недавняя общая родословная с современными популяциями в SSM поддерживает одну из гипотетических родин для их кочевых тюркских и родственных монгольских предков.

Резюме Авторов:

Столетия кочевых миграций в конечном итоге привели к распространению тюркских языков на обширном пространстве от Сибири, Центральной Азии до Восточной Европы и Ближнего Востока. Несмотря на глубокое культурное воздействие, оставленное этими кочевыми народами, мало что известно об их доисторическом происхождении. Более того, поскольку современные тюркскоязычного происхождения склонны генетически напоминать своих географических соседей, неясно, оставили ли их кочевые предки идентифицируемый генетический след. В этом исследовании мы показываем, что тюркоязычные народы, опробованные на Ближнем Востоке, на Кавказе, в Восточной Европе и в Центральной Азии, имеют разную пропорцию азиатских предков, которые происходят в одном регионе, в Южной Сибири и Монголии. Монгольское и тюркоязычное население этой области имеет необычно большое количество длинных хромосомных путей, которые идентичны по происхождению тюркским народам со всей Западной Евразии. Распад индуцированной примесью неравновесности сцепления по хромосомам в этих популяциях указывает на то, что примесь произошла в IX-XVII вв., в соответствии с исторически зафиксированными тюркскими кочевыми миграциями и позднее монгольской экспансией. Таким образом, наши результаты показывают генетические следы недавних крупномасштабных кочевых миграций и отображают их источник на ранее предполагаемую область Монголии и южной Сибири.

(текст, идущий далее, ответа на наш вопрос не содержащий оставляю для любознательных, а Вас, Штирлиц, попрошу сразу пройти вместе со мной до выделенного тремя галками заголовка )

Введение

Лингвистическую связанность часто используют для информирования о генетических исследованиях [1], и здесь мы идем по этому пути, чтобы восстановить аспекты крупного и относительно недавнего демографического события, расширения кочевых тюркоязычных народов, которые изменили большую часть западно-евразийского этнолингвистического ландшафта в течение последних двух тысячелетий. Современное тюркоязычное население является в значительной степени оседлым народом; Они насчитывают более 170 миллионов по всей Евразии и, после периода миграций, охватывающих период V-XVI вв., Имеют широкий географический разброс, охватывающий Восточную Европу, Ближний Восток, Северный Кавказ, Центральную Азию, Южную Сибирь, Северный Китай и Северо-Восточную Сибирь [2-4].

Существующее разнообразие тюркских языков, на которых говорят в этом обширном географическом разрезе, отражает только недавнюю (2100-2300 лет) историю расхождения, которая включает в себя крупный раскол на Огур (или Болгар) и Общность тюркских языков [5, 6]. Этому периоду предшествовал ранний древнетюркский язык, для которого нет исторических данных и длительная прототюркская стадия, если в 4500-4000 г.г. до н. Э. Существовало тюрко-монгольское лингвистическое единство (протоязык) [7, 8].

Самые ранние тюркские правители (между 6 и 9 веками) были сосредоточены в тех местах, что сейчас является Монголией, северным Китаем и южной Сибирью. Соответственно, этот регион был выдвинут в качестве отправной точки для расселения тюркоязычных пастушеских кочевников [3, 4]. Мы обозначаем его здесь как «Внутренняя Азиатская Родина» (IAH) и отмечаем по крайней мере два вопроса с этой рабочей гипотезой. Во-первых, в той же самой приблизительной области ранее доминировала Империя Xiongnu (Hsiung-nu) (200 г. до н.э.-100 н.э.), а затем короткоживущая Конфедерация Сиань-сь (100-200 гг. Н.э.) и Руран (ака Хуан-цзюань или азиатский авар) (400-500 гг. Н. Э.). Эти степные политики, вероятно, были созданы не тюркскими языками и предположительно объединились в этнически разнообразные племена. Только во второй половине VI в. Тюркоязычные народы получили контроль над регионом и образовали быстро расширяющийся каганат Гектюрк, который вскоре овладел многими территориями и создал многочисленные ханства и каганаты, простирающиеся от северо-восточного Китая до понтийско-каспийских степей в Европе [2] -4]. Во-вторых, Göktürks представляет собой самую раннюю из известных этнических групп, в которой тюркские народы появляются под именем Turk. Тем не менее, тюркоязычные народы появляются в письменных исторических источниках до этого времени, а именно, когда огурические тюркоязычные племена появляются в Северных Причерноморских степях в 5-м веке, намного раньше, чем возникновение Гектюркского каганата в ИАХ (Внутренней Азиатской Родине) [9]. Таким образом, ранние этапы тюркского расселения остаются малоизученными, и наше знание об их древней среде обитания остается рабочей гипотезой.

Предыдущие исследования на основе Y-хромосомы, митохондриальной ДНК (мтДНК) и аутосомных маркеров показывают, что, в то время как тюркские народы из Западной Азии (анатолийские турки и азербайджанцы) и Восточной Европы (гагаузы, татары, чуваши и башкиры) в целом генетически подобны своим Географическим соседям, они действительно демонстрируют незначительную долю как мтДНК, так и Y гаплогрупп, что характерно для Восточной Азии [10-15]. Ожидается, что среднеазиатские тюркские носители (кыргызы, казахи, узбеки и туркмены) больше разделяют свой унипартарный генофонд (9-76% Y-хромосомы и более 30% мтДНК-линий) с восточноазиатскими и сибирскими популяциями [16, 17]. В этом отношении они отличаются от своих южных не тюркских соседей, включая таджиков, иранцев и представителей различных этнических групп в Пакистане, кроме Хазары. Однако эти исследования не направлены на то, чтобы идентифицировать точный географический источник и время прибытия или смешивания восточно-евразийских генов среди современных тюркоязычных народов. «Восточная» мтДНК и тем более Y-хромосомные линии (с учетом разрешения, доступного исследованиям того времени) не имеют географической специфики, чтобы четко различать регионы в Северо-Восточной Азии и Сибири и / или тюркские и не тюркские носители языка в регионе [18, 19].

В нескольких исследованиях, в которых используются данные SNP-панели по всему геному, описывается генетическая структура популяций в Евразии, и хотя некоторые из них включают в себя различные тюркские популяции [15, 20-24], они не сосредоточены на выяснении демографического прошлого тюркоязычного континуума. В тех случаях, когда для сравнения доступно более одного географического соседа, тюркоязычные народы генетически близки к своим не тюркским географическим соседям в Анатолии [22, 25], на Кавказе [15] и в Сибири [21, 23]. Недавний опрос населения во всем мире показал, что в трех тюркских популяциях (турки, узбеки и уйгуры) был обнаружен сигнал (13-14 вв.) И одно не тюркское население (лезгины) с монголами (из северного Китая), даурсы Говорящего на монгольском языке) и хазарей (монгольского происхождения) [26]. Это исследование также показало наличие примесей (относящихся к домонгольскому периоду 440-1080 гг. Н.э.) среди не тюркских (за исключением чувашей) восточноевропейских и балканских народов с исходной группой, связанной с современными орокенами, монголами и якутами. Это первое генетическое доказательство исторического потока генов из северокитайского и сибирского источников в некоторые северные и центральные евразийские популяции, но неясно, относится ли этот сигнал к другим тюркским популяциям через Западную Евразию. Здесь мы спрашиваем, возможно ли это Чтобы идентифицировать явный генетический сигнал (ы), разделяемый всеми тюркскими народами, которые, вероятно, произошли от предполагаемых доисторических кочевых турок. В частности, мы проверяем, имеют ли разные тюркские народы генетическое наследие, которое можно отнести к гипотетическому ИАХ. Более конкретно, мы спрашиваем, произошло ли это общее происхождение в исторический период времени, что подтверждается избытком длинных хромосомных трактов, идентичных по происхождению между тюркоязычными народами Западной Евразии и населяющими ИАХ. Для решения этих вопросов мы использовали массив генотипирования с высокой плотностью генома для генерации данных о тюркоязычных народах, представляющих все основные ветви языковой семьи (рис. 1B).

Рис. 1. Географическая карта образцов, включенных в данное исследование, и лингвистическое дерево тюркских языков.
Рис. 1. Географическая карта образцов, включенных в данное исследование, и лингвистическое дерево тюркских языков.

Панель А) В нетурецкоязычных группах показаны светло-голубые, светло-зеленые, темно-зеленые, светло-коричневые и желтые круги в зависимости от региона. Тюркоязычные популяции показаны красными кругами независимо от региона выборки. Полные имена населения приведены на S1 Таблица B) Лингвистическое дерево тюркских языков адаптировано из Dybo 2004 и включает только те языки, на которых говорят тюркские народы, проанализированные в этом исследовании. Ось x показывает шкалу времени в кило-годах (кья). Внутренние ветви показаны разными цветами.

Http://dx.doi.org/10.1371/journal.pgen.1005068.g001

Результаты

Чтобы охарактеризовать популяционную структуру тюркоязычных популяций в контексте их географических соседей по всей Евразии, мы генотипировали 322 новых образца из 38 евразийских популяций и объединили его с ранее опубликованными данными (см. Таблицу S1, материалы и методы для деталей), чтобы получить Общий набор данных из 1444 образцов, генотипированных по 515 841 маркерам. Новые образцы, представленные в этом исследовании, географически охватывают ранее недопредставленные регионы, такие как Восточная Европа (Волго-Уральский регион), Средняя Азия, Сибирь и Ближний Восток. Мы использовали STRUCTURE-подобный подход, реализованный в программе ADMIXTURE [28], чтобы исследовать генетическую структуру в евразийских популяциях, выведя наиболее вероятное количество генетических кластеров и пропорций смешивания, соответствующих наблюдаемым данным генотипа (от K = 3 Через K = 14 групп) (S1 Fig). Как показано в предыдущих исследованиях [15, 20, 29], популяции в Восточной Азии обычно содержали аллели, которые находят членство в двух общих кластерах, показанных здесь как k6 и k8, в модели, предполагающей популяцию K = 8 «предков» (рис. 2). Географически зона распространения этих двух компонентов (кластеров) была сосредоточена в Сибири и Восточной Азии, соответственно. Их общая распространенность снизилась, когда один из них двигался на запад от Восточной Азии (корреляция с долготой, p = 8,8 × 10-16, R = 0,77, 95% ДИ: 0,66-0,85). В целом, аллели тюркских популяций, отобранных по Западной Евразии, показали принадлежность к одному набору генетических кластеров Западной Евразии, k1-k4, как и их географические соседи. Кроме того, племена волжско-уральских тюрков (чуваши, татары и башкиры) также представили членство в кластере k5, в котором находились сибирские уралоязычные популяции (нганасаны и ненцы) и распространялись на некоторых европейских уральских ораторов (Марис, Удмуртов и коми). Однако в большинстве случаев тюркские народы показали более высокое совместное присутствие «восточных компонентов» k6 и k8, чем их географические соседи.

Рис. 2. Структура населения, выведенная с использованием анализа ADMIXTURE.
Рис. 2. Структура населения, выведенная с использованием анализа ADMIXTURE.

Результаты ADMIXTURE при K = 8 показаны. Каждый человек представлен вертикальной (100%) стопкой столбцов, указывающей пропорции родословной в К, построенных популяциями предков. Тюркоязычные популяции показаны красным цветом. На верхнем графике показаны только тюркоязычные популяции.

Http://dx.doi.org/10.1371/journal.pgen.1005068.g002

Тест с тремя популяциями

«Восточные компоненты» k6 и k8, выведенные среди тюркских и не тюркских народов через Западную Евразию, а также «западные компоненты» k1, k2 и k3, присутствующие среди сибирских популяций, могут возникнуть в результате эпизодов распространения генома в противоположных направлениях в Прошлом, и эта история популяционного смешения может быть статистически проверена с использованием f3-статистики [30, 31]. Для оценки сценариев добавок, предложенных в анализе ADMIXTURE, мы протестировали все три комбинации популяций в нашем наборе данных, используя тест трех популяций (f3-статистика) [30, 31]. Мы сообщали только популяционные трионы f3 (target, source1, source2) с наиболее отрицательной f3-статистикой (таблица S2) и считали, что популяции значительно смешивались, когда их Z-счет был меньше 1,64 (т.е. p-значение было меньше 0,05, Для одностороннего теста). Наши тесты с тремя популяциями показали, что почти все западно-евразийские тюркские народы (15 из 16) и их нетюркские соседи (49 из 61) (см. Таблицу S2 для географического подразделения) были смешаны с восточно-азиатскими и сибирскими Населения. Аналогичным образом, все популяции сибирских тюрков, а также некоторые (11 из 27) восточно-евразийских не тюркских популяций показали сигнал о примеси к популяциям, связанным с Западной Европой. При интерпретации результатов f3-статистики важно указать, что сообщенные исходные популяции не обязательно представляют истинные смешающие популяции [31]. Хотя точные исходные популяции были неопределенными, значительная отрицательная f3-статистика дала убедительные доказательства для примеси в большинстве тюркских и не тюркских популяций в нашем наборе данных. Чтобы проверить, являются ли эти сигналы примеси результатом недавних событий потока генов, мы в дальнейшем исследовали распределение длинных хромосомных трактов, разделяемых между популяциями в нашем наборе данных.

Географическое распространение недавних общих родословных

Недавнее исследование показывает, что даже пара неродственных людей из противоположных концов Европы делят сотни хромосомных путей ВЗК от общих предков, которые жили в течение последних 3000 лет. Количество таких недавних предков уменьшается экспоненциально с географическим расстоянием между парами популяций, и такая зависимая от расстояния картина может быть искажена из-за расширения популяции или потока генов [32]. Мы наблюдали достаточно высокую корреляцию (коэффициент корреляции Пирсона = 0,77, 95% ДИ: 0,76-0,79, р <2,2 × 10-16) между скоростью распада IBD и географическим расстоянием в нашем наборе евразийских популяций. Эта зависящая от расстояния картина, вероятно, формируется как изоляцией на расстояние, так и потоком генов: многие популяции смешиваются (отрицательная f3-статистика в таблице S2), и существует долговременное зависимое снижение распространенности «восточных компонентов», K6 и k8. Некоторые популяции могут выделяться в этом зависимом от расстояния образце из-за изоляции, большего потока генов или генетического дрейфа. Например, когда мы удалили из нашего набора данных западно-евразийские тюрки (пробы на Ближнем Востоке, на Кавказе, в Восточной Европе и Средней Азии), мы наблюдали лучшую корреляцию между распадом совместного распределения IBD и географическими расстояниями между популяциями (коэффициент корреляции Пирсона = 0,83 , 95% ДИ: 0,82-0,85, р <2,2 × 10-16). Для идентификации популяций, для которых обмен IBD с тюркоязычными популяциями отличается от зависящего от расстояния распада, мы сначала вычислили распределение IBD (средняя длина генома IBD, измеренного в centiMorgans) для каждого из 12 западнотюркских популяций со всеми другими популяциями в наборе данных (Таблица S3), а затем вычитали ту же статистику, рассчитанную для их географических соседей (подробности см. В разделе «Материалы и методы» и S2 Fig для схематического представления этого анализа). Когда различия были наложены на все 12 тюркских популяций, мы обнаружили необычно высокий сигнал накопления IBD (образцы отмечены «плюсом» на рис. 3A-3C) для популяций за пределами Западной Евразии. Коррелированный сигнал совместного использования IBD для этих отдаленных популяций превысил ожидания, основанного на зависящей от расстояния структуре распада. Большинство этих отдаленных популяций расположены в Южной Сибири и Монголии (ССМ) и в Северо-Восточной Сибири, за исключением двух образцов в Восточной Европе (Марис) и на Северном Кавказе (калмыки). В принципе, когда мы сравниваем паттерн распределения ИБД таким образом между соседними тюркскими и не тюркскими популяциями, мы можем наблюдать высокий сигнал о совместном ВБД с некоторыми популяциями Сибири из-за дрейфа в одной из популяций по сравнению, но вероятность того, что такие случайные сигналы Будет коррелировать между несколькими тюркскими популяциями и накапливаться в одном регионе, ничтожно. Действительно, нулевая гипотеза для этого анализа не предполагала систематической разницы между любым тюркским населением и их соответствующими географическими соседями. Поэтому нулевая гипотеза предсказывает, что случайные различия накапливаются во всем географическом ареале западнотюркских популяций. Чтобы продемонстрировать это нулевое ожидание, мы заменили каждую из западнотюркских популяций популяциями, случайно выбранными из наборов соответствующих нетюркских соседей, и повторили этот анализ вычитания / накопления, как показано на S2 Fig. Когда наборы случайных не тюркских образцов Были протестированы, накопленный сигнал был ограничен популяциями (обозначен «плюсовым символом» на S3 Fig) в пределах Западной Евразии, как и ожидалось нулевой гипотезой. Есть, однако, два исключения (нганасанцы и ненцы), которые при тщательном рассмотрении предлагают интересный вывод, согласующийся с нашими результатами ADMIXTURE. Эти две сибирские популяции, Nganasans и Nenets (S3A, S3B, S3E, S3I и S3J Fig) говорят на уральских языках и демонстрировали высокий накопленный сигнал только тогда, когда в наших тестируемых наборах были западные уральские ораторы (Maris, Komis, Vepsas и Udmurts) . Это соответствовало нашим результатам ADMIXTURE (рис. 2), поскольку компонент родословной k5 был определен специально между этими западными оралоязычными ораторами и двумя сибирскими уралоязычными нганасанцами и ненцами. Теперь вернемся к общей разнице между накопленным сигналом разделения IBD при нулевой гипотезе (см. S3 Fig) и наблюдаемым для множества западных тюркских популяций (рис. 3). Некоторые популяции в ССМ и Северо-Восточной Сибири продемонстрировали сильный сигнал о совместном ВБД с популяциями западных тюрков, и эта картина, скорее всего, указывает на недавний поток генов из Сибири. Чтобы сузить источник этого потока генов, важно знать, какая из сибирских популяций является коренной для их текущего местоположения. Мы показываем в разделе «Обсуждение», что только тувинцы, буряты и монголы из области SSM являются коренными по отношению к их текущим местоположениям (по крайней мере, в пределах известного исторического времени), и поэтому эта область является лучшим кандидатом на источник потока недавних генов в Западных тюрках. Следует отметить, что эта направленность на восток-запад подразумевается тем фактом, что 12 популяций, отобранных по разным западноевропейским регионам, вряд ли будут показывать коррелированный сигнал о высоком распределении ВБД с одним регионом, если они не получат от него поток генов. Действительно, когда мы повторили наш анализ случайным выбором не тюркских популяций (S2 Fig), мы не смогли воспроизвести подобный коррелированный сигнал.

(продолжение следует)

Ещё статьи на эту тему:

Круг Земной, R1a1, татаро-монголы и Поднебесная… русские – татары?

Миграция и её влияние на генетику

О загадочных сунгирьцах

Денисо-тартарийцам слава?

Что-что он там про греков-русов?

ДНК монголов, татар и европеоидов

Генофонд Новгородчины

Сибиряки ли наши братья сербы? Откуда родом славяне

Генетики нашли следы нашествия монголов