О распространении тюркской генетики 2

20 November 2017

продолжение. Начало Дополнительно о разпространении тюркской генетики

Параллельный ВБД, основанный на длинных сегментах 1-2 см.

Для каждой популяции, упорядоченной вдоль оси x, совместное использование IBD вычисляется с тремя популяциями SSM (тувинцы, буряты, монголы) и эвенки. Каждое тюркоязычное население (показано красным) сгруппировано с соответствующими географическими соседями, используя круглые скобки. Сгруппированные географические соседи объединялись и использовались для выполнения теста перестановки, как описано в разделе M & M. Красные цифры под названием тюркского населения указывают, сколько популяций SSM демонстрирует статистически значимое превышение распределения IBD с данным тюркским населением. Обратите внимание, что, например, башкиры, татары и чуваши делятся своими географическими соседями.

Рис.4
Рис.4

Пространственная картина в совместном использовании IBD была отмечена, когда тракты IBD разных классов длин считались отдельно. Для сегментных классов 1-2 cM и 2-3 cM более высокое разделение IBD является статистически значимым для большинства тюркских ораторов, за исключением гагаузов и чувашей (и татар в случае 2-3 cM). Для более длинных трактов IBD 3-4 см, статистические данные для более высокого совместного распределения IBD становятся более слабыми в некоторых образцах на Ближнем Востоке и на Кавказе (азербайджанцы, кумыки и балкарцы). Под более слабыми доказательствами мы имеем в виду, что статистически значимое превышение совместного использования ВБД ограничивалось подгруппой четырех тестируемых кандидатов-предков. В Приволжско-Уральском регионе для одного и того же класса сегментов (3-4 см) только башкиры продолжали демонстрировать убедительные доказательства генных потоков, а татары и чуваши - нет. Для этих двух тюркоязычных популяций не все тесты были статистически значимыми, так как фоновая группа, из которой были сделаны перестановленные выборки, содержала популяцию мари, говорящую на финском языке, которая показывает сопоставимые уровни азиатской примеси (рис. 2) и распределения IBD (S4 Fig). Когда мы рассматривали даже более длинные сегменты (4-5 см и 5-6 см), мы больше не наблюдали систематического избытка совместного использования IBD для тюркских народов на Ближнем Востоке, на Кавказе или в Волго-Уральском регионе. Напротив, популяции, расположенные ближе к зоне SSM (узбеки, казахи, кыргызы и уйгуры, а также башкиры из Приволжско-Уральского региона), все же продемонстрировали статистически значимое превышение распределения ВБД. Эта пространственная картина может быть частично объяснена относительной редкостью более длинных трактов IBD по сравнению с более короткими и повторными событиями потока генов в популяции, ближе к области SSM.

Встречайте возраст азиатской примеси с помощью методов ALDER и SPCO

Согласно историческим записям, тюркские миграции происходили в основном в течение ~ V-XVI вв. (Мало что известно о более ранних периодах) и частично совпадают с монгольской экспансией. Предполагая, что 30 поколений за поколение, обычные сибирские предки различных тюркских народов жили до и во время этого миграционного периода между 20 и 53 поколениями назад. Ожидаемая длина однопутного тракта IBD, унаследованного от общего предка, который прожил ~ 20-53 поколения назад, колеблется между 2,5 и 0,94 сантиморганцами (подробности см. В разделе «Методы»). Принимая во внимание, что многопутевые пути IBD будут в среднем более длинными [33], сигнал совместного использования IBD при 1-5 сМ, обнаруженный между народами Западной тюрки и населением района SSM, может быть вызван историческими тюркскими и монгольскими расширениями от SSM площадь. Можно приблизительно очертить возраст общих предков непосредственно из распределения общих трактов IBD [32], но такой вывод был бы слишком грубым для наших целей. Здесь мы используем два различных метода, реализованных в ALDER [34] и SPCO [35], чтобы определить возраст сибирской / азиатской примеси среди тюркских народов. Даты добавок для всех проанализированных тюркских народов (рис. 5 и таблица S4) относятся к историческим временным рамкам (5-17 вв.), которые пересекаются с периодом кочевых миграций, вызванных тюрками (VI-XVI вв. Н. Э.) и монгольскими экспансиями XIII в.) [2, 3]. Тем не менее, индивидуальные даты смешения, оцененные с использованием этих двух методов, частично перекрываются и являются дискордантными для большинства популяций (рис. 5). Поэтому мы смоделировали серию событий примеси, охватывающую целевой исторический период, и сравнили, как эти два метода выполнялись (подробности см. В разделе «Материал и методы»). Даты, полученные ALDER, как правило, ближе к моделируемым истинным значениям, тогда как SPCO последовательно оценивает несколько более старые даты (рис. 6). Важно отметить, что датированные SPCO даты для нашего реального набора данных (рис. 5) также имели тенденцию быть более старыми, и поэтому мы подозреваем предвзятость в наших оценках SPCO. Далее мы обсудим только даты, которые были определены с помощью ALDER.

Даты смешения тюркоязычных популяций в абсолютной дате.

Синие круги показывают оценки по ALDER-inferred point, а ошибки показывают 95% -ные доверительные интервалы. Серые круги показывают оценки SPCO-inferred point, а столбцы ошибок в сером указывают 95% -ные доверительные интервалы. Красная полоса показывает диапазон оценки точек (по ALDER) по всем проанализированным образцам, а оранжевая полоса показывает то же самое для дат SPCO-inferred. Даты смешивания до нашей эры (CE) показаны с отрицательным знаком.

Рис 5
Рис 5

Даты смешивания для смоделированных популяций.

Моделированные популяции были получены путем смешивания двух популяций предков G поколениями назад, как описано в разделе M & M. Мы повторяли каждый сценарий добавления 120 раз и анализировали с использованием двух методов датирования примесей: ALDER и SPCO. Круги представляют собой даты примесей для одного смоделированного населения, а цвет окружности указывает метод вывода примеси, как показано в легенде. Красные «плюс символы» показывают истинную дату добавления.

Рис.6
Рис.6

Смешанный сигнал неравновесного сцепления в смешанной популяции «восстанавливается» с использованием двух суррогатов (контрольных популяций), и когда проверено несколько таких пар, ALDER позволяет сравнить их генетическую близость с истинными популяциями смешивания на основе амплитуды взвешенного LD Кривой [36]. Следует, однако, отметить, что выводы, сделанные таким образом, могут вводить в заблуждение, когда исходная популяция, генетически связанная с истинным микширующим населением, подвергается самой добавке. В этом случае другая менее родственная популяция будет выведена как лучший суррогат для истинной смешанной популяции. Мы рассмотрели все возможные комбинации популяций в нашем наборе данных в качестве ссылок на тюркоязычные популяции и сообщим о наборе «лучших» пар (таблица S4), демонстрирующих наибольшую амплитуду взвешенной кривой ЛД. Интерпретация этих результатов, однако, сложна, поскольку некоторые из этих ссылок смешиваются сами по нашим трем популяционным тестам (таблица S2). Мы не можем исключить возможность того, что некоторые из ссылок, действительно связанных с историческими предками, дали меньшую амплитуду, потому что они были примешаны. Например, популяции SSM, которые продемонстрировали сигнатуру недавнего потока генов (избыток путей IBD) в западнотюркских популяциях, показали более низкую амплитуду взвешенной добавки LD по сравнению с несмешанными ссылками, которые мы сообщали в таблице S4. Популяции SSM значительно замечены (см. Таблицу S2), и это, вероятно, произошло во время тюркского миграционного периода (таблица S4).

Хотя мы сообщаем об одной дате добавления каждой популяции, мы отмечаем, что вполне вероятно, что современные тюркские народы были установлены несколькими волнами миграции [2-4, 37]. Действительно, тюркские народы, расположенные ближе к области SSM (из Приволжско-Уральского региона и Средней Азии), показали более низкие даты по сравнению с более отдаленными группами населения, такими как анатолийские турки, иранские азербайджанцы и северокавказские балкарцы. Из этого пространственного рисунка выделяются только ногайцы, бывшие кочевые племена степного пояса и кумыки, обитающие на северных склонах Кавказа.

Обсуждение

Наш анализ ADMIXTURE (рис. 2) показал, что тюркоязычные популяции, разбросанные по всей Евразии, имеют тенденцию разделять большую часть своей генетической родословной со своими нынешними географическими не тюркскими соседями. Это особенно очевидно для тюркоязычных народов в Анатолии, Иране, на Кавказе и в Восточной Европе, но труднее определить для северо-восточных сибирских тюркских ораторов, якутов и долганцев, для которых нетуртские референтные популяции отсутствуют. Мы также обнаружили, что более высокая доля азиатских генетических компонентов отличает тюркских ораторов по всей Западной Евразии от их ближайших не тюркских соседей. Эти результаты подтверждают модель о том, что экспансия тюркской языковой семьи за пределы ее предполагаемого восточно-евразийского ядра происходила в основном за счет замены языка, возможно, с помощью сценария доминирования элиты, то есть интрузивные тюркские кочевники навязывали свой язык коренным народам из-за преимуществ в военной и / Или социальной организации.

Когда тюркские народы переселялись через Западную Евразию, сравниваются со своими не тюркскими соседями, они демонстрируют более высокий уровень обмена ВБД с популяциями ССМ и Северо-Восточной Сибири (рис. 3). Есть, однако, две несибирские популяции, которые также демонстрируют высокий уровень обмена ВБД с обследованными тюркскими народами, калмыками и марисом. Эти исключения требуют тщательного рассмотрения в свете исторических данных и ранее опубликованных исследований. Например, монголоязычные калмыки мигрировали на Северный Кавказ из Джунгарии (северо-западная провинция Китая на монгольской границе) только в 17 веке [37], в то время как Марис выделяется из других географических соседей из-за необычно высокой недавней примеси с башкирами : Они демонстрируют более высокий обмен IBD с башкирами для всех классов длины тракта IBD (от 1-2 см до 11-12 см) по сравнению с другими популяциями в регионе (p <0,05). Это можно объяснить тем, что мы собрали образцы марис в Республике Башкортостан, где они, по-видимому, в какой-то мере вступали в смешанные браки с башкирами. Наконец, некоторые из сибирских популяций на самом деле являются мигрантами в их нынешнем местонахождении. Например, якуты, эвенки и долганы в основном происходят из района озера Байкал, который по сути является зоной ССМ [23]. Оказывается, что большинство популяций, демонстрирующих высокий уровень обмена IBD с западнотюркскими популяциями, происходят из области SSM или имеют примесь с одним из исследованных тюркских популяций. Единственное исключение - нганасаны; Они демонстрируют необычно высокое разделение IBD как на западнотюркских народов (рис. 3), так и случайно выбранных не тюркских популяций (S3 Fig). Учитывая, что популяции SSM (тувинцы, монголы и буряты) можно надежно считать коренными по отношению к их местонахождению и что все остальные сибирские и несибирские популяции (демонстрирующие высокий уровень распределения IBD с западнотюркскими народами на рис. 3), все имеют происхождение SSM , Мы предполагаем, что популяции предков из этой области способствовали недавнему потоку генов в народы Западной тюрки. Мы отмечаем, что SSM, соответствующие трассам IBD, также наблюдались со значительной частотой среди некоторых не тюркских народов, таких как адыгэ, марис, северные осетины и удмурты (рис. 4 и S4 рис.), Предполагая, что поток генов из области SSM также способствовал -Туркические популяции. В этой связи нельзя исключать альтернативные объяснения, не связанные с тюркскими и монгольскими миграциями, но эти исторические события остаются наиболее вероятным сценарием, поскольку высокая доля совпадающих трактов ССМ является объединяющим признаком многих народов Западной Тюрки и таким коррелированным сигналом Разделение с сибирскими популяциями не наблюдается ни для какой другой группы популяций (S3 Fig). Таким образом, вполне вероятно, что мигранты происхождения ССМ взаимодействовали со многими предками современного западноевропейского населения, но именно более сильное взаимодействие (отраженное в более высоком разделении IBD) с предками мигрирующих SSM, которые вели тюркизацию. Мы провели тест на перестановку для каждой западной тюркской популяции, и наблюдаемый избыток совместного распределения IBD (по сравнению с не тюркскими соседями) с популяциями области SSM был статистически значимым (рис. 4 и S4 рис.).

Другим важным результатом нашего анализа совместного использования IBD является вывод о том, что две из трех популяций SSM, которые мы считаем «исходными популяциями» или современными прокси для популяций-источников, являются как говорящими на монголоязычных языках. Это наблюдение можно объяснить несколькими способами. Например, можно предположить, что завоевания монголов, начиная с XIII века, сопровождались их демографической экспансией по уже занятым территориям, в частности, тюркскими носителями, что привело к смешению между тюркскими и монгольскими ораторами. В качестве альтернативы, также вероятно, что предки тюркских и монгольских племен происходят из одного и того же или почти одного и того же района и подвергались многочисленным эпизодам примеси до их соответствующих экспансий.

Последнее объяснение косвенно свидетельствует сложная, долговременная стратиграфия монгольских заимствованных слов в тюркских языках и наоборот [38]. Первое объяснение маловероятно с исторической точки зрения, так как хотя монгольские завоевания были начаты войсками Чингисхана в начале XIII века, хорошо известно, что они не предполагали массовых переселений монголов над завоеванными территориями. Вместо этого монгольская военная машина постепенно расширялась различными тюркскими племенами по мере их расширения, и таким образом тюркские народы в конечном итоге усиливали свое распространение по евразийской степи и за ее пределами [39]. Поэтому мы предпочитаем второе объяснение, хотя мы не можем полностью исключить монгольский вклад, особенно в свете дат дат, которые совпадают с монгольским периодом расширения.

Наконец, наш анализ распределения IBD показал, что область SSM является источником недавнего потока генов. Этот район является одной из гипотетических родины для тюркских народов и лингвистически связанных монголов. В то время как присутствие Монгольской империи над этой территорией хорошо зафиксировано, одних исторических источников недостаточно, чтобы однозначно связать эту область с тюркской родиной по нескольким причинам: некоторые тюркские группы, говорящие на огурической ветви тюркских языков, были засвидетельствованы западными в Понтийско- Каспийские степи в середине-конце V в. Это географически удалено от области SSM, и временно намного раньше, чем империя Гектюрк была создана в районе SSM. Таким образом, в нашем исследовании представлены первые генетические данные, подтверждающие, что один из ранее гипотетических ИАХ находился вблизи Монголии и Южной Сибири.

Поток генов из области SSM, который мы вывели на основании нашего анализа распределения IBD, также должен быть обнаружен с использованием альтернативного подхода, такого как ALDER, который основан на анализе паттернов неравновесия сцепления (LD) из-за примеси. Используя метод ALDER, мы протестировали все возможные комбинации ссылочных групп в нашем наборе данных. Паттерны затухания LD, наблюдаемые среди западнотюркских популяций, были совместимы с примесью между западноевропейскими и восточноазиатскими / сибирскими популяциями (см. Обнаруженные контрольные популяции в таблице S4). Примесь, датируемая множеством восточноазиатских / сибирских популяций (таблица S4), выводила события примеси в диапазоне от 816 до н.э. для чувашей и 1657 н.э. для ногайцев. Мы выбрали эти контрольные популяции, исходя из самых высоких амплитуд кривой ЛД, как предполагают авторы метода. Примечательно, что все популяции SSM, которые, по предположению, являлись источником потока SSM-гена, либо отфильтровывались по процедуре предварительного тестирования ALDER из-за общего сигнала примеси с тестируемыми тюркскими популяциями, либо имели более низкую амплитуду взвешенного LD По сравнению с несмешанными ссылками. Действительно, как мы показываем, популяции SSM и два северо-восточных сибирских популяций все продемонстрировали статистически значимый сигнал примеси между тем же набором популяций Западной Евразии и Восточной Азии, что и народы Западной Тюрки (таблица S2 и таблица S4). Таким образом, набор контрольных популяций, указанных в таблице S4, демонстрирующих наивысшую амплитуду кривой ЛД, фактически представляет собой набор неимеющихся контрольных популяций (таблица S2), которые прошли процедуру фильтрации ALDER. Этот фильтр удаляет любую ссылочную совокупность, которая показывает общий сигнал примеси с тестируемой совокупностью. Для нашего исследования было важно, что диапазон дат ALDER-предполагаемой примеси совпадает с крупными тюркскими миграциями, а затем и с монгольским распространением (рис. 5), которые, как известно, вызывают кочевые миграции в Средневековую Среднюю Азию, Ближний Восток и Европу. Кроме того, при учете лингвистической классификации и регионального контекста мы нашли параллели с крупномасштабными историческими событиями. Например, современные татары, башкиры, казахи, узбеки и кыргызы простираются от бассейна Волги до гор Тянь-Шаня в Центральной Азии, однако (рис. 5) свидетельствуют о недавней примеси в XIII-XIV вв. . Эти народы говорят на тюркских языках кипчакско-карлукской ветви, и их возраст примесей позволяет утверждать предполагаемые миграции предков-турок-кипчаков из Иртыша и Обской области в XI веке [37]. Есть исключения, такие как балкары, кумыки и ногайцы на Северном Кавказе, которые показали либо более ранние даты примеси (8-й век), либо значительно более позднюю примесь между 15-м веком (кумыки) и 17-м веком (ногайцами).

Чуваши, единственные сохранившиеся огурские ораторы, показали более старшую дату пришествия (IX век), чем их соседи, говорящие по-кипчакски в Поволжье. Согласно историческим источникам, когда в VII веке Онугур-Болгарская империя (северные черноморские степи) распалась, некоторые ее остатки мигрировали к северу вдоль правого берега Волги и установили то, что позднее стало называться Волжскими болгарами, Из которых первые письменные знания появляются в мусульманских источниках лишь в конце IX века [40]. Таким образом, сигнал примеси для чувашей близок к предполагаемому времени прибытия огурцев в Поволжье.

Различия в датах добавок для трех огузских популяций (азербайджанцев, турок и туркмен) были заметны, и их географическое положение указывает на возможное объяснение. Анатолийские тюрки и азербайджанцы, чьи среднеазиатские предки пересекли иранское плато и стали в значительной степени недоступными для последующего генных потоков с другими тюркскими носителями, как свидетельствуют о более ранних событиях примеси (XII и IX вв. Соответственно), чем туркмены. Туркмены, оставшиеся в Центральной Азии, показали значительно более недавнюю примесь, датированную XIV веком, в соответствии с другими тюркскими народами Центральной Азии и, скорее всего, из-за смешения с более свежими, возможно, повторяющимися волнами мигрантов в регионе от ССМ. Наша коллекция образцов, которая охватывает всю распространенность нынешнего распределения тюркских народов, показывает, что большинство тюркских народов имеют значительную долю своего генома со своими географическими соседями, поддерживая модель элитного доминирования для распространения тюркского языка. Мы также показали, что почти все западнотюркские народы сохранили в своем геноме общую родословную, которую мы проводим в регионе ССМ. Таким образом, мы предоставляем генетические доказательства для Внутренней Азии родины (ИАХ) первопроходцев носителей тюркского языка, ранее выдвинутых другими на основе исторических данных. Кроме того, из-за того, что тюркские народы сохранили в своих геномах корни предков ССМ, мы смогли провести датирование примесей, и предполагаемые даты находятся в хорошем согласии с историческим периодом тюркских миграций и перекрытием экспансии монголов. Наконец, многое еще предстоит узнать о демографических последствиях этого сложного исторического события, а дальнейшие исследования позволят распутать многочисленные сигналы о примеси в геноме человека и мелкомасштабное картирование географического происхождения отдельных хромосомных трактов.

VVV Материалы и методы

Заявление об этике

Все субъекты подписали персональные информированные согласия, а этические комитеты участвующих учреждений одобрили исследование.

Образцы, генотипирование и контроль качества

В целом, 322 человека из 38 популяций были генотипированы на разных массивах SNP Illumina (все нацелены на> 500 000 SNP) в соответствии с спецификациями производителей. Наши данные были объединены с опубликованными данными Li et al. [20], Rasmussen et al. [21], Behar et al. [22], Юнусбаев и др. [15], Metspalu et al. [29], Федорова и др. [23], Raghavan et al. [41], Behar et al. [42], и охватили все тюркоязычные популяции (373 человека из 22 образцов) из ключевых регионов по всей Евразии и их географических соседей (см. Подробности об источнике выборки в таблице S1). Лица с более чем 1,5% отсутствующих генотипов были удалены из комбинированного набора данных. Сохранены только маркеры с 97% -ой частотой генотипирования и меньшей частотой аллелей (MAF)> 1%. Отсутствие криптической связности, соответствующей родственникам первой и второй степени в нашем наборе данных, было подтверждено с помощью King [43]. Этапы фильтрации привели <b>к набору данных из 1444 человек, оставшихся для последующего анализа. Важно отметить, что в нашем наборе данных имеется 315224 SNP, которые являются общими для Human1M-Duo и 650k, 610k и 550k Illumina BeadChips. Различные анализы имеют разные требования к плотности маркеров, и поэтому мы подготовили два набора данных. Для приложений проводились трехпольные испытания и ALDER-анализы, требующие минимального фонового LD, обрезание LD на объединенном наборе данных 1M-Duo и 650k, 610k и 550k. Набор маркеров был разрежен путем исключения SNP в сильном LD (парная генотипическая корреляция r2> 0,4) в окне 1000 SNP, сдвигая окно на 150 SNP за раз. Это привело к набору данных 174 187 SNP. Был подготовлен еще один набор данных с плотным маркером для совместного использования IBD и анализа вейвлет-преобразований для датирования вейвлет-преобразований. Для этого были исключены генотипированные образцы 1M-Duo (таблица S1), чтобы увеличить перекрытие SNP среди оставшихся образцов до 515 841 маркеров. Генетические расстояния между SNPs в centiMorgans были включены с генетической карты, созданной проектом HapMap [44]. (далее предоставляю свободу изучать статью самостоятельно)

Приступим.

После фильтрации (соответственно цели исследования) набора данных осталось 1444 человека. Согласитесь, что 373 тюркоязычные особи никак не равны 1444 человекам.

Откуда набрались недостающие? Из ранее полученных данных (образцов). Это указано в статье:

"Наши данные были объединены с опубликованными данными Li et al. [20], Rasmussen et al. [21], Behar et al. [22], Юнусбаев и др. [15], Metspalu et al. [29], Федорова и др. [23], Raghavan et al. [41], Behar et al. [42], и охватили все тюркоязычные популяции (373 человека из 22 образцов) из ключевых регионов по всей Евразии и их географических соседей (см. Подробности об источнике выборки в таблице S1)."

А где именно располагаются популяции тюркоязычные и нетюркоязычные (географические соседи), смотрим на рисунке №1. 

В самой статье также говорится, что генетически тюркоязычные популяции отличаются от нетюркоязычных своих соседей "длинными цепочками", которые родом из ССМ (современной Южной Сибири и Монголии). То есть, дополнительная генетика и тюркоязычие связаны друг с другом. Отуречились местные жители в результате генетического вливания. И время этого события тоже в статье указано.

на рисунке тюркоязычные этносы (их название) указаны красным цветом шрифта. Остальные - чёрным. Это и есть "соседи". Из рисунка видно, что татаро-монгольскую составляющую (розовая краска) имеют и не тюркоязычные. Это может означать только одно - культуру тюрков и их язык не приняли.
на рисунке тюркоязычные этносы (их название) указаны красным цветом шрифта. Остальные - чёрным. Это и есть "соседи". Из рисунка видно, что татаро-монгольскую составляющую (розовая краска) имеют и не тюркоязычные. Это может означать только одно - культуру тюрков и их язык не приняли.

Произвожу эту разборку здесь с той целью, чтобы более подобными разборами текстов не заниматься с нежелающими вникать самостоятельно.

Ну и шкеты нынче пошли... -)

читать вместе со статьёй Генетики нашли следы нашествия монголов (или после неё)

Начало Дополнительно о разпространении тюркской генетики

Также по теме:

Круг Земной, R1a1, татаро-монголы и Поднебесная… русские – татары?

Миграция и её влияние на генетику

О загадочных сунгирьцах

Денисо-тартарийцам слава?

Что-что он там про греков-русов?

ДНК монголов, татар и европеоидов

Генофонд Новгородчины

Сибиряки ли наши братья сербы? Откуда родом славяне