Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

ДНК. Хромосома. Ген. Наследственность. Простыми словами.

Попытка кратко изложить теорию ДНК-генеалогии. Записки самообучения.

← Назад    Вперед →Страницы: ← Назад 1 2 * 3 4 Вперед →
Модератор: tmaua
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Почему получилась разница в сМ на разных сайтах?
Все в том, что Gedmatch, как и другие сайты, проверяет только определенный набор SNP, а не все из вашего набора.
Поэтому, чем на большее кол. сайтов подгрузим свой тест, тем больше шансов что-то найти и получить более достовернуют итоговую картину.

На сайте Autosomal SNP comparison можно посмотреть сколько SNP теститует конкретная компания и какие из тестируемых SNP пересекаются между тестами разных компаний.

Для сравнения приведу и текущие цены на минимальный тест (акции могут уменьшать цену):
https://www.gedmatch.com/ тесты не продает, сюда загружают тесты любых компаний для проф. анализа.
https://www.23andme.com/ $99.00 Ancestry DNA + Traits
https://www.ancestry.com/ $99.00 Ancestry DNA
https://www.familytreedna.com/ $79 Family Finder
https://livingdna.com/ $99 Ancestry DNA
https://www.myheritage.com $79/$59(сейчас скидка) Ancestry DNA


Отсюда и растут ноги такого термина как Overlap.
Overlap - это сколько SNP пересекаются в тестах от двух разных компаний. Чем больше Overlap, тем достовернее результат.
На первом рисунке показан скрин сравнения моего myheritage-теста с тестами других людей(сделанные в разных компаниях) на сайте gedmatch. Колонка Overlap показывает насколько можно доверять сравнению двух тестов (красненькое - уже под вопросом).

Прикрепленный файл: overlap.pngAutosomal_X_SNP_overlap.jpg, 257741 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
При сравнении своего теста ДНК с другими всегда работает правило, чем больше размер наибольшего(largest) куска, тем потенциально ближе родня.
Опять же, каждый сайт считает немного по своему алгоритму, но суть везде одинакова.

Например, на Gedmatch при сравнении моего аутосомного теста ДНК с другими получаем таблицу где есть колонки: (Autosomal) Total cM, Largest.

Если кусочки в совпадении маленькие, это может быть шум, а не совпадении. Есть таблица вероятности составленная каждой компанией в которой указаны вероятность ложного совпадения (шума) в зависимости от размера кусочка.
Пример чтения таблицы.
Компания FTDNA говорит,
что кусочек 6 сМ в 20% будет ложным совпадением(шумом),
а кусочек 10 сМ в 2% будет ложным совпадением (шумом).

Поэтому учитивать маленькие кусочки сМ имеет смысл только если есть документальное подтверждение родства.
Если в двух тестах совпадающие кусочки по 3-4-5 сМ, в большинстве случаев можно игнорировать такие совпадения и считать их шумом.

Прикрепленный файл: cМ_procent.jpgautosomal_largest.jpg, 21976 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Сразу стоит проверить все имеющиеся ДНК тесты родных на близкородственные связи (inbreeding, endogamy).
На сайте Gedmatch есть бесплатная утилита "Are your parents related?".
Указав номер теста получим результат анализа, сообщающий связаны ли родственно родители данного образца.

В большинстве случаев мы видим отсутствие такой связи:
"Largest segment = 0 cM
Total of segments > 7 cM = 0 cM
No shared DNA segments found
This analysis indicates that your parents are probably not related within recent generations."

Если же это не так, тогда анализ совпаденцев осложняется. В некоторых калькуляторах есть галочка для "евреев ашкенази", которые имели столетиями скрещивание внутри замкнутой популяции.
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Близкородственные связи (Multiple relationships) это отдельная головная боль и требует большей квалификации при исследовании.
Приведу лишь самый простой случай близкородственной связи (для общего понимания вопроса).

Есть два типа двоюродных братьев:
Двоюродные братья - те, у кого только мамы являются родными сестрами ИЛИ только папы являются родными братьями.
"Двойные" двоюродные братья - те, у кого мамы являются родными сестрами И папы являются родными братьями.

1st Cousins (двоюродные братья) - имеют примерно 12,5% общего ДНК. Все совпадения ДНК будут только Нalf-match, т.е. только по одной из хромосом (одна от матери, вторая от отца). Потому что они связаны только по одному родителю!
Double 1st Cousins ("двойные" двоюродные братья) - имеют примерно 25% общего ДНК. Могут быть совпадения ДНК типа Full-Match, т.е. по двум хромосомам сразу (одна от матери, вторая от отца). Потому что они связаны как по матери так и по отцу!

В моих тестах и родословной таких связей не замечено, поэтому далее эту тему развивать не буду.

Прикрепленный файл: Double_1st_Cousins.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Первая "пристрелка" по ДНК делается методом сравнения свого набора со всеми другими в базе.
На разных сайтах это реализуется разными алгоритмами.

Пример с сайта Gedmatch.
Free Tools -> One-To-Many - Limited Version
Указываем свой набор теста. В результате видим таблицу всех совпаденцем.
Самые важные поля: largest segment, total cM

P.S. Цифры в полях largest segment / total cM могут быть не совсем корректные (плюс-минус). Для более точных цифр нужно провести сравнение один к одному.

Прикрепленный файл: one_to_many.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (3)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Далее, для более точного анализа, нужно использовать сравнения один-к-одному.
На Gedmatch есть возможность сравнить:
Free Tools -> One-to-One Autosomal DNA Comparison (сравнение один-к-одному по аутосомам)
Free Tools -> One-to-One X-DNA Comparison (сравнение один-к-одному по половой X-хромосоме)

Если идет сравнение с близкими родственниками, имеет смысл ставить опцию "Prevent Hard Breaks (default is to create hard breaks when distance between SNP's exceeds 500,000 base positions)"

Я сравнил свой тест с тестом матери и отца. Наглядно видно, что целая хромосома приходит от отца и целая хромосома приходит от матери.
На рисунке показан совмещенный рисунок обеих сравнений меня с матерью.
Синяя полоска означает совпадение с большой вероятностью.

Прикрепленный файл: I_mother_graph.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Еще одиним важным и наиболее часто используемым инструментом является нахождение общих совпаденцев по ДНК.

Имеется дерево, в котором Александр и его двоюродная тетка Мария сдали тест ДНК.
На Gedmatch есть возможность указать два набора ДНК и найти общих совпаденцев:
Free Tools -> People who match both, or 1 of 2 kits

Получим таблицу "Kits that match both" в которой будут люди совпадающие по ДНК сразу обоим указанным наборам (т.е. Александру и его двоюродной тетке Марии).

Все эти общие совпаденцы "вылезли" точно через Петра Трофимовича или Феклу Карповну.
Т.е. для Александра всех этих совпаденцев нужно точно искать по прадеду-прабабке по материнской линии. Поиск значительно сузился, что хорошо.


Прикрепленный файл: DNA_both1.jpgDNA_both2.jpg, 247393 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Как было показано на рисунках ранее, при рождении сына и дочери им приходит разный набор половых хромосом. У девочки XX, мальчика XY.

Рассмотри половую X хромосому поподробнее.

Когда мы делаем аутосомный ДНК тест, то он также тестирует и X хромосому!
На Gedmatch есть возможность сравнить X хромосому из вашего набора:
Free Tools -> One-To-Many - Limited Version, выбрать Filter By: X (сравнить ваш набор со всеми наборами из базы Gedmatch)
Free Tools -> One-to-One X-DNA Comparison (сравнить ваш набор с конкретным одним набором)

Мой результат сравнения представлен на рисунке.
Проанализируем результаты.
У меня и моей матери по X хромосоме совпадение 181.1 сМ Total, 98.5 cМ Largest.
У меня и трех членов какой-то семьи по X хромосоме совпадение 22-30 сМ Total, 22-30 cМ Largest. Причем совпадения по Autosomal нет вообще!

Когда есть совпадение по X, но нет совпадения по аутосомным хромосомам - это означает, что связь достаточно далекая, в пределах 7-8 поколения, но дальше чем 3d cousin (четвероюродный). Т.е надо искать в пределах 5-6-7 юродного родства.
Но это еще не все подсказки, X хромосама наследуется определенным образом:
сын(XY) получает одну из Х хромосом (возможно рекомбинированную) от матери(XX).
дочь(XX) получает одну из Х хромосом (возможно рекомбинированную) от матери(XX) И одну нетронутую Х хромосому от отца(XY).

Есть два шаблона наследования X хромосам для девочек и мальчиков, построенные по вышеозначенному правилу.
(см. два рисунка шаблонов)

Т.е. мы можем построть веерный график своего дерева и дерева совпаденца и позначить те ветви откуда могла прийти X хромосома. Это значительно сузит поиск!

Совпадения по X хромосоме меньше 15 cМ можно считать шумом.

P.S.
They're likely to be from connections within the last 7 or 8 generations, although the absence of any autosomal matching suggests it's more distant than 3rd cousins (i.e. beyond 2nd great grandparents). Smaller X-chromosome matching segments (< 10cM) should be discounted except for the special case of a male-to-male match.

Females have two X-chromosomes and therefore strands of SNPs from both sides can be used to form matching segments to yourself. If any of them are male, then it is probably a real segment but possible a very distant connection.




Прикрепленный файл: X_female.pngX_Male.jpg, 124200 байтX_match.png, 25043 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
В ДНК человека 99% участков общие между всеми людьми. Отличия в 1%.
Чтобы последить отличия между людьми нужно извлекать данные именно из этого 1%.

Как можно извлечь и проанализировать ДНК человека?
Есть две основные технологии:
-chipping (вычитывается 1% из 1% отличающихся между людьми кусков ДНК. Т.е. только отдельные SNP(снипы))
-sequencing (вычитывается весь 1% отличающихся между людьми кусков ДНК.)

Большинство компаний работают по технологии "chipping", так как это значительно дешевле. Стоит отметить, что разные компании могут использовать разное оборудование(разный chip), что ведет к вычитке разных SNP. Поэтому тесты разных компаний могут иметь лишь небольшое пересечение в SNP. Это стоит учитывать, т.е. сравнение двух тестов сделанных в одной компании будет более достоверно, чем сделанное в разных.

На рисунке показаны текущие цены на chipping (99$) и sequencing (999$).


Прикрепленный файл: DNA_Full.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Заглянем "под капот" аутосомного теста ДНК.
После обработки теста мы получаем обычний CSV-файл(таблица), который можем скачать на свой компьютер.

Для примера покажу результат от MyHeritage.
Сам файл размером 25 Mb выглядит как длинная-длинная таблица.
Вначале идет шапка(желтым), где указана дата и версия чипа на котором проводилось тестирование.
Далее идет заголовок таблицы с четырьма колонками.
После чего идет список всех протестированных SNP(снипов) который составляет 500-600 тысяч строк (разные фирмы тестируют разное колличество SNP).

Названия колонок означают следующее:
RSID - resourse number, название SNP.
Chromosome - номер хромосомы на которой расположен SNP.
Position - позиция на хромосоме в которой расположен SNP.
Result - само значение SNP, это две буковки (нуклеотиды) в (Allele 1 | Allele 2), т.е. один отцовский, другой материнский (какой из них чей неизвестно)

Прикрепленный файл: DNA_example.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
← Назад    Вперед →Страницы: ← Назад 1 2 * 3 4 Вперед →
Модератор: tmaua
Генеалогический форум » Дневники участников » Дневники участников » Дневник Tmaua » ДНК. Хромосома. Ген. Наследственность. Простыми словами. [тема №123655]
Вверх ⇈