На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Киев Сообщений: 990 На сайте с 2021 г. Рейтинг: 532
Наверх##23 октября 2021 16:4823 октября 2021 16:52
Заглянем "под капот" аутосомного теста ДНК. После обработки теста мы получаем обычний CSV-файл(таблица), который можем скачать на свой компьютер.
Для примера покажу результат от MyHeritage. Сам файл размером 25 Mb выглядит как длинная-длинная таблица. Вначале идет шапка(желтым), где указана дата и версия чипа на котором проводилось тестирование. Далее идет заголовок таблицы с четырьма колонками. После чего идет список всех протестированных SNP(снипов) который составляет 500-600 тысяч строк (разные фирмы тестируют разное колличество SNP).
Названия колонок означают следующее: RSID - resourse number, название SNP. Chromosome - номер хромосомы на которой расположен SNP. Position - позиция на хромосоме в которой расположен SNP. Result - само значение SNP, это две буковки (нуклеотиды) в (Allele 1 | Allele 2), т.е. один отцовский, другой материнский (какой из них чей неизвестно)
Поговорим о таком важном термине как Триангуляция (Triangulation).
Если "кусочек" ДНК на определенной позиции совпадает сразу у трех человек это и есть триангуляция. Все эти три человека будут иметь общего предка (за редким исключением). Если мы видим триангуляцию, то это подтверждает, что данный "кусочек" ДНК не ложное совпадение (false match), а достоверное и такому совпадению можно верить. На сайте MyHeritage триангуляция отображается в виде значка "пластырь". Например, на рисунке показано, что человек 1, совпадает с человеком 2 и одновременно совпадает с человеком 3, т.е. между ними имется триангуляция. На том же рисунке человек 1, совпадает с человеком 2 и одновременно совпадает с человеком 3*, т.е. между этой тройкой также есть триангуляция.
На сайте GedMatch в платной версии есть возможности найти все такие триангуляции. Tier 1 Tools -> Triangulation. Т.е. мы видим все группы "триангулированных" сегментов. Например, на рисунке все люди с красными кусочками будут иметь общего предка.
Как видно из хромосомного браузера, некоторые кусочки на хромосомах не протестированы (светятся заштрихованными). В данных областях таблицы SNP не проработаны достаточно хорошо для того чтобы извлечь их них достаточно полезной информации. Поэтому кусочки на хромохомах 13,14,15,21,22 игнорируются.
Наглядный пример сравнения ДНК наборов (только 1й хромосомы для простоты) одного и того же человека, но сделанного в разных компаниях. MyHeritage к MyHeritage = 32742 SNPs MyHeritage к LivingDNA = 28199 SNPs MyHeritage к 23andMe = 31999 SNPs MyHeritage к Ancestry = 14333 SNPs
Меньше всего пересекающихся снипов в наборах MyHeritage к Ancestry, что и видно по цвету (сероватый).
Как выглядит автокластер MyHeritage у евреев ашкенази. Вот почему намного сложнее искать родство в данной популяции. Все друг-другу дальние родственники.
Почему при сравнении на разных площадках мы видим разные результаты. Первое, каждая компания использует свой проприетарный алгоритм. Второе Imputation/Импутация.
"Imputation in genetics refers to the statistical inference of unobserved genotypes."
"Мы создаем расширенный отчет, заполняя пробелы типичных тестов генотипирования ДНК на основе микрочипов с помощью статистических моделей. Этот процесс известен как импутация генотипа."
В данном примере, MyHeritage методом импутации добавила часть снипов в ДНК тест. В частности, снипа RS980712 нет в ДНК-тесте и он был импутирован.
А если к кусочкам 7-11 сМ добавляется много мелких кусков по 3-6 сМ, и ищется глубокое, не близкое родство, их можно учитывать?
[/q]
Все что меньше дефолтных 7 сМ я рассматриваю только в случаях наличия множества поверочных тестов и наличия обших локаций с совпаденцем или уже построенного дерева указывающего на кровное родство. Во всех других случаях это поиск иголки в стоге сена.