На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Почему получилась разница в сМ на разных сайтах? Все в том, что Gedmatch, как и другие сайты, проверяет только определенный набор SNP, а не все из вашего набора. Поэтому, чем на большее кол. сайтов подгрузим свой тест, тем больше шансов что-то найти и получить более достовернуют итоговую картину.
На сайте Autosomal SNP comparison можно посмотреть сколько SNP теститует конкретная компания и какие из тестируемых SNP пересекаются между тестами разных компаний.
Отсюда и растут ноги такого термина как Overlap. Overlap - это сколько SNP пересекаются в тестах от двух разных компаний. Чем больше Overlap, тем достовернее результат. На первом рисунке показан скрин сравнения моего myheritage-теста с тестами других людей(сделанные в разных компаниях) на сайте gedmatch. Колонка Overlap показывает насколько можно доверять сравнению двух тестов (красненькое - уже под вопросом).
При сравнении своего теста ДНК с другими всегда работает правило, чем больше размер наибольшего(largest) куска, тем потенциально ближе родня. Опять же, каждый сайт считает немного по своему алгоритму, но суть везде одинакова.
Например, на Gedmatch при сравнении моего аутосомного теста ДНК с другими получаем таблицу где есть колонки: (Autosomal) Total cM, Largest.
Если кусочки в совпадении маленькие, это может быть шум, а не совпадении. Есть таблица вероятности составленная каждой компанией в которой указаны вероятность ложного совпадения (шума) в зависимости от размера кусочка. Пример чтения таблицы. Компания FTDNA говорит, что кусочек 6 сМ в 20% будет ложным совпадением(шумом), а кусочек 10 сМ в 2% будет ложным совпадением (шумом).
Поэтому учитивать маленькие кусочки сМ имеет смысл только если есть документальное подтверждение родства. Если в двух тестах совпадающие кусочки по 3-4-5 сМ, в большинстве случаев можно игнорировать такие совпадения и считать их шумом.
Сразу стоит проверить все имеющиеся ДНК тесты родных на близкородственные связи (inbreeding, endogamy). На сайте Gedmatch есть бесплатная утилита "Are your parents related?". Указав номер теста получим результат анализа, сообщающий связаны ли родственно родители данного образца.
В большинстве случаев мы видим отсутствие такой связи: "Largest segment = 0 cM Total of segments > 7 cM = 0 cM No shared DNA segments found This analysis indicates that your parents are probably not related within recent generations."
Если же это не так, тогда анализ совпаденцев осложняется. В некоторых калькуляторах есть галочка для "евреев ашкенази", которые имели столетиями скрещивание внутри замкнутой популяции.
Близкородственные связи (Multiple relationships) это отдельная головная боль и требует большей квалификации при исследовании. Приведу лишь самый простой случай близкородственной связи (для общего понимания вопроса).
Есть два типа двоюродных братьев: Двоюродные братья - те, у кого только мамы являются родными сестрами ИЛИ только папы являются родными братьями. "Двойные" двоюродные братья - те, у кого мамы являются родными сестрами И папы являются родными братьями.
1st Cousins (двоюродные братья) - имеют примерно 12,5% общего ДНК. Все совпадения ДНК будут только Нalf-match, т.е. только по одной из хромосом (одна от матери, вторая от отца). Потому что они связаны только по одному родителю! Double 1st Cousins ("двойные" двоюродные братья) - имеют примерно 25% общего ДНК. Могут быть совпадения ДНК типа Full-Match, т.е. по двум хромосомам сразу (одна от матери, вторая от отца). Потому что они связаны как по матери так и по отцу!
В моих тестах и родословной таких связей не замечено, поэтому далее эту тему развивать не буду.
Первая "пристрелка" по ДНК делается методом сравнения свого набора со всеми другими в базе. На разных сайтах это реализуется разными алгоритмами.
Пример с сайта Gedmatch. Free Tools -> One-To-Many - Limited Version Указываем свой набор теста. В результате видим таблицу всех совпаденцем. Самые важные поля: largest segment, total cM
P.S. Цифры в полях largest segment / total cM могут быть не совсем корректные (плюс-минус). Для более точных цифр нужно провести сравнение один к одному.
Далее, для более точного анализа, нужно использовать сравнения один-к-одному. На Gedmatch есть возможность сравнить: Free Tools -> One-to-One Autosomal DNA Comparison (сравнение один-к-одному по аутосомам) Free Tools -> One-to-One X-DNA Comparison (сравнение один-к-одному по половой X-хромосоме)
Если идет сравнение с близкими родственниками, имеет смысл ставить опцию "Prevent Hard Breaks (default is to create hard breaks when distance between SNP's exceeds 500,000 base positions)"
Я сравнил свой тест с тестом матери и отца. Наглядно видно, что целая хромосома приходит от отца и целая хромосома приходит от матери. На рисунке показан совмещенный рисунок обеих сравнений меня с матерью. Синяя полоска означает совпадение с большой вероятностью.
Киев Сообщений: 990 На сайте с 2021 г. Рейтинг: 532
Наверх##11 октября 2021 12:3411 октября 2021 12:50
Еще одиним важным и наиболее часто используемым инструментом является нахождение общих совпаденцев по ДНК.
Имеется дерево, в котором Александр и его двоюродная тетка Мария сдали тест ДНК. На Gedmatch есть возможность указать два набора ДНК и найти общих совпаденцев: Free Tools -> People who match both, or 1 of 2 kits
Получим таблицу "Kits that match both" в которой будут люди совпадающие по ДНК сразу обоим указанным наборам (т.е. Александру и его двоюродной тетке Марии).
Все эти общие совпаденцы "вылезли" точно через Петра Трофимовича или Феклу Карповну. Т.е. для Александра всех этих совпаденцев нужно точно искать по прадеду-прабабке по материнской линии. Поиск значительно сузился, что хорошо.
Киев Сообщений: 990 На сайте с 2021 г. Рейтинг: 532
Наверх##18 октября 2021 12:2318 октября 2021 12:51
Как было показано на рисунках ранее, при рождении сына и дочери им приходит разный набор половых хромосом. У девочки XX, мальчика XY.
Рассмотри половую X хромосому поподробнее.
Когда мы делаем аутосомный ДНК тест, то он также тестирует и X хромосому! На Gedmatch есть возможность сравнить X хромосому из вашего набора: Free Tools -> One-To-Many - Limited Version, выбрать Filter By: X (сравнить ваш набор со всеми наборами из базы Gedmatch) Free Tools -> One-to-One X-DNA Comparison (сравнить ваш набор с конкретным одним набором)
Мой результат сравнения представлен на рисунке. Проанализируем результаты. У меня и моей матери по X хромосоме совпадение 181.1 сМ Total, 98.5 cМ Largest. У меня и трех членов какой-то семьи по X хромосоме совпадение 22-30 сМ Total, 22-30 cМ Largest. Причем совпадения по Autosomal нет вообще!
Когда есть совпадение по X, но нет совпадения по аутосомным хромосомам - это означает, что связь достаточно далекая, в пределах 7-8 поколения, но дальше чем 3d cousin (четвероюродный). Т.е надо искать в пределах 5-6-7 юродного родства. Но это еще не все подсказки, X хромосама наследуется определенным образом: сын(XY) получает одну из Х хромосом (возможно рекомбинированную) от матери(XX). дочь(XX) получает одну из Х хромосом (возможно рекомбинированную) от матери(XX) И одну нетронутую Х хромосому от отца(XY). Есть два шаблона наследования X хромосам для девочек и мальчиков, построенные по вышеозначенному правилу. (см. два рисунка шаблонов)
Т.е. мы можем построть веерный график своего дерева и дерева совпаденца и позначить те ветви откуда могла прийти X хромосома. Это значительно сузит поиск!
Совпадения по X хромосоме меньше 15 cМ можно считать шумом.
Киев Сообщений: 990 На сайте с 2021 г. Рейтинг: 532
Наверх##22 октября 2021 11:5922 октября 2021 12:04
В ДНК человека 99% участков общие между всеми людьми. Отличия в 1%. Чтобы последить отличия между людьми нужно извлекать данные именно из этого 1%.
Как можно извлечь и проанализировать ДНК человека? Есть две основные технологии: -chipping (вычитывается 1% из 1% отличающихся между людьми кусков ДНК. Т.е. только отдельные SNP(снипы)) -sequencing (вычитывается весь 1% отличающихся между людьми кусков ДНК.)
Большинство компаний работают по технологии "chipping", так как это значительно дешевле. Стоит отметить, что разные компании могут использовать разное оборудование(разный chip), что ведет к вычитке разных SNP. Поэтому тесты разных компаний могут иметь лишь небольшое пересечение в SNP. Это стоит учитывать, т.е. сравнение двух тестов сделанных в одной компании будет более достоверно, чем сделанное в разных.
На рисунке показаны текущие цены на chipping (99$) и sequencing (999$).
Киев Сообщений: 990 На сайте с 2021 г. Рейтинг: 532
Наверх##23 октября 2021 16:4823 октября 2021 16:52
Заглянем "под капот" аутосомного теста ДНК. После обработки теста мы получаем обычний CSV-файл(таблица), который можем скачать на свой компьютер.
Для примера покажу результат от MyHeritage. Сам файл размером 25 Mb выглядит как длинная-длинная таблица. Вначале идет шапка(желтым), где указана дата и версия чипа на котором проводилось тестирование. Далее идет заголовок таблицы с четырьма колонками. После чего идет список всех протестированных SNP(снипов) который составляет 500-600 тысяч строк (разные фирмы тестируют разное колличество SNP).
Названия колонок означают следующее: RSID - resourse number, название SNP. Chromosome - номер хромосомы на которой расположен SNP. Position - позиция на хромосоме в которой расположен SNP. Result - само значение SNP, это две буковки (нуклеотиды) в (Allele 1 | Allele 2), т.е. один отцовский, другой материнский (какой из них чей неизвестно)