Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

ДНК. Хромосома. Ген. Наследственность. Простыми словами.

Попытка кратко изложить теорию ДНК-генеалогии. Записки самообучения.

← Назад    Вперед →Страницы: 1 * 2 3 4 Вперед →
Модератор: tmaua
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Вся ДНК это 3 миллиарда пар "буковок" запакованных в 23 пары хромосом.
При делении клетки эти 3 миллиарда пар "буковок" переписываются в новую клетку.
При таких переписываниях иногда бывают опечатки,точечные мутации, которые переходят потомству.
Такая единичная опечатка и есть снип (SNP). Single Nucleotide Polymorphism - однонуклеотидный полиморфизм.
Теперь если два человека заведут ребенка, то у него в паре хромосом в одной и той же позиции будут разные "буковки" (одна от папы, вторая от мамы).

....ААTGTACGCTA...... хромосома отца
....ААTGTATGCTA...... хромосома матери

На сегодня известно порядка 10 000 000 (10 миллионов) возможных снипов(SNP) у людей.
Это все те возможные варианты опечаток которые человечество успело уже сделать за время развития человечества.
У каждого человека эти опечатки унаследованы от своих предков.
Два человека тем ближе генетически друг к другу чем идентичнее их снипы.
В результатах теста ДНК снипы указываются как rsXXXXXXX (rs3091244, rs6313, rs148649884, ...)

Почитать какие снипы сущетвуют и за что они отвечают можно на snpedia.

Пример:
Снип Rs145999145 расположен в хромосоме 19, в гене PLD3, в позиции 40371688.
Если по этим координатам в вашей паре хромосом стоят буковки (A;A) - то у вас в 2 раза выше риск заболеть Альцгеймером.
Если там стоят буковки (G;G) - все хорошо у вас.


Прикрепленный файл: SNP2.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
В участках мусорной ДНК также есть много интересного.
Ученые подметили, что в мусорных участках ДНК существуют многократные повторения определенных комбинаций "буковок".
Назвали такие повторения термином STR (SHORT TANDEM REPEAT).
Колличество "буковок" в повторяющемся фрагменте (base pairs) бывает от 2 до 10.
Колличество повторов (repeats) таких фрагметов обычно от 5 до 50.

Есть много известных STR и их локусов. Ведется общая база STRBase.

Такие STR начали применять в криминалистике, определении отцовства и т.д.
Рассмотрим два примера.

Пример 1. Определение преступника.
Есть биологический материал с места преступления.
Извлекаем из 14-й хромосомы в 13-ти известных локусах образцы STR.
ФБР в США ведет базу ДНК-образцов под названием CODIS.
Проводим проверку в базе CODIS по нашему образцу.
На рисунке видно, что все 13-ть STR из образца (Subject A) в точности совпали c одним человеком из базы (Subject B).
Совпадение 13-ти STR дает нам вероятность ошибки 1 из 100 триллионов.
Преступник определен c почти 100% вероятностью и осталось только его задержать.

Пример 2. Определение отцовства.
Взяли образец ДНК у ребенка, матери и предполагаемого отца.
Проверили 13-ть STR.
В одной хромосоме ребенка будут STR от матери, во второй STR от отца.
Точность определения отца и матери близко к 100%.

Обычно STR описываются в следующем формате:
THO1 6,8 - где THO1 это название STR; 6,8 это колличество повторов в паре хромосом.
AATGAATGAATGAATGAATGAATG - в хромосоме отца 6 повторов
AATGAATGAATGAATGAATGAATGAATGAATG - в хромосоме матери 8 повторов


Прикрепленный файл: STR1.jpgSTR.jpg, 131757 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Определившись с базовыми терминами перейду к практике.
Я и мои родственники сдали аутосомный тест в фирме MyHeritage.
На сегодня есть несколько основных конкурентов, каждый может выбрать на свой вкус.
В свое время MyHeritage выбрало меня как "титульного українця" :-) и прислало мне тест бесплатно, далее уже работал с ними.

Сделав тест (потерев щеточкой за щекой) ожидаем результаты несколько недель-месяцев.
Результаты теста и всех совпаденцев можно посмотреть на сайте.
Далее свой тест можно скачать в виде CSV-файла или экспортировать на другие сайты.
Есть много сторонних сайтов которые позволяют посмотреть на ваш тест под разными углами (используя разные калькуляторы ДНК).
Желательно подгрузить ваш тест сразу на все сторонние сайты, т.к. некоторые сайты принимают только свежие (полугодичные) результаты.

---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
После миграции аутосомного теста с https://www.myheritage.com/ на https://www.familytreedna.com/ и https://www.gedmatch.com/ можно посмотреть результаты.

MyHeritage

Я и отец.
Общие ДНК: 49,6% (3 513,7‎ cM)
Общие сегменты: 26
Наибольший сегмент: 284,3‎ cM

Я и мать.
Общие ДНК: 49,4% (3 505,0‎ cM)
Общие сегменты: 29
Наибольший сегмент: 284,3‎ cM

Gedmatch
One to Many (7cM min)

Я и мать.
Общие ДНК (autosomal): 3568.7
Наибольший сегмент: 151.8
Общие ДНК (X-DNA): 0
Наибольший сегмент: 0

Я и мать. .
Общие ДНК (autosomal): 3570 cM
Наибольший сегмент: 151.8 cM
Общие ДНК (X-DNA): 181.1 cM
Наибольший сегмент: 98.5 cM

Как видим на разных сайтах немного разные калькуляторы и цифры немного разнятся.

Бля примера, буду увеличивать на 1сМ минимальный совпадающий кусок, чтобы примерно понять динамику.
Gedmatch
One to one (7 cM min)
Я и мать.
Largest segment = 146.4 cM
Total Half-Match segments (HIR) 3555.1cM (99.132 Pct)
52 shared segments

One to one (8 cM min)
Я и мать.
Largest segment = 146.4 cM
Total Half-Match segments (HIR) 3548cM (98.935 Pct)
51 shared segments found for this comparison.

One to one (9 cM min)
Largest segment = 146.4 cM
Total Half-Match segments (HIR) 3539.5cM (98.696 Pct)
50 shared segments found for this comparison.

... без изменений

One to one (17 cM min)
Largest segment = 146.4 cM
Total Half-Match segments (HIR) 3491.9cM (97.37 Pct)
47 shared segments found for this comparison.

One to one (18 cM min)
Largest segment = 146.4 cM
Total Half-Match segments (HIR) 3474.3cM (96.878 Pct)
46 shared segments found for this comparison.
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Почему получилась разница в сМ на разных сайтах?
Все в том, что Gedmatch, как и другие сайты, проверяет только определенный набор SNP, а не все из вашего набора.
Поэтому, чем на большее кол. сайтов подгрузим свой тест, тем больше шансов что-то найти и получить более достовернуют итоговую картину.

На сайте Autosomal SNP comparison можно посмотреть сколько SNP теститует конкретная компания и какие из тестируемых SNP пересекаются между тестами разных компаний.

Для сравнения приведу и текущие цены на минимальный тест (акции могут уменьшать цену):
https://www.gedmatch.com/ тесты не продает, сюда загружают тесты любых компаний для проф. анализа.
https://www.23andme.com/ $99.00 Ancestry DNA + Traits
https://www.ancestry.com/ $99.00 Ancestry DNA
https://www.familytreedna.com/ $79 Family Finder
https://livingdna.com/ $99 Ancestry DNA
https://www.myheritage.com $79/$59(сейчас скидка) Ancestry DNA


Отсюда и растут ноги такого термина как Overlap.
Overlap - это сколько SNP пересекаются в тестах от двух разных компаний. Чем больше Overlap, тем достовернее результат.
На первом рисунке показан скрин сравнения моего myheritage-теста с тестами других людей(сделанные в разных компаниях) на сайте gedmatch. Колонка Overlap показывает насколько можно доверять сравнению двух тестов (красненькое - уже под вопросом).

Прикрепленный файл: overlap.pngAutosomal_X_SNP_overlap.jpg, 257741 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
При сравнении своего теста ДНК с другими всегда работает правило, чем больше размер наибольшего(largest) куска, тем потенциально ближе родня.
Опять же, каждый сайт считает немного по своему алгоритму, но суть везде одинакова.

Например, на Gedmatch при сравнении моего аутосомного теста ДНК с другими получаем таблицу где есть колонки: (Autosomal) Total cM, Largest.

Если кусочки в совпадении маленькие, это может быть шум, а не совпадении. Есть таблица вероятности составленная каждой компанией в которой указаны вероятность ложного совпадения (шума) в зависимости от размера кусочка.
Пример чтения таблицы.
Компания FTDNA говорит,
что кусочек 6 сМ в 20% будет ложным совпадением(шумом),
а кусочек 10 сМ в 2% будет ложным совпадением (шумом).

Поэтому учитивать маленькие кусочки сМ имеет смысл только если есть документальное подтверждение родства.
Если в двух тестах совпадающие кусочки по 3-4-5 сМ, в большинстве случаев можно игнорировать такие совпадения и считать их шумом.

Прикрепленный файл: cМ_procent.jpgautosomal_largest.jpg, 21976 байт
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Сразу стоит проверить все имеющиеся ДНК тесты родных на близкородственные связи (inbreeding, endogamy).
На сайте Gedmatch есть бесплатная утилита "Are your parents related?".
Указав номер теста получим результат анализа, сообщающий связаны ли родственно родители данного образца.

В большинстве случаев мы видим отсутствие такой связи:
"Largest segment = 0 cM
Total of segments > 7 cM = 0 cM
No shared DNA segments found
This analysis indicates that your parents are probably not related within recent generations."

Если же это не так, тогда анализ совпаденцев осложняется. В некоторых калькуляторах есть галочка для "евреев ашкенази", которые имели столетиями скрещивание внутри замкнутой популяции.
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Близкородственные связи (Multiple relationships) это отдельная головная боль и требует большей квалификации при исследовании.
Приведу лишь самый простой случай близкородственной связи (для общего понимания вопроса).

Есть два типа двоюродных братьев:
Двоюродные братья - те, у кого только мамы являются родными сестрами ИЛИ только папы являются родными братьями.
"Двойные" двоюродные братья - те, у кого мамы являются родными сестрами И папы являются родными братьями.

1st Cousins (двоюродные братья) - имеют примерно 12,5% общего ДНК. Все совпадения ДНК будут только Нalf-match, т.е. только по одной из хромосом (одна от матери, вторая от отца). Потому что они связаны только по одному родителю!
Double 1st Cousins ("двойные" двоюродные братья) - имеют примерно 25% общего ДНК. Могут быть совпадения ДНК типа Full-Match, т.е. по двум хромосомам сразу (одна от матери, вторая от отца). Потому что они связаны как по матери так и по отцу!

В моих тестах и родословной таких связей не замечено, поэтому далее эту тему развивать не буду.

Прикрепленный файл: Double_1st_Cousins.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (1)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Первая "пристрелка" по ДНК делается методом сравнения свого набора со всеми другими в базе.
На разных сайтах это реализуется разными алгоритмами.

Пример с сайта Gedmatch.
Free Tools -> One-To-Many - Limited Version
Указываем свой набор теста. В результате видим таблицу всех совпаденцем.
Самые важные поля: largest segment, total cM

P.S. Цифры в полях largest segment / total cM могут быть не совсем корректные (плюс-минус). Для более точных цифр нужно провести сравнение один к одному.

Прикрепленный файл: one_to_many.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (3)
tmaua
Модератор раздела

tmaua

Киев
Сообщений: 990
На сайте с 2021 г.
Рейтинг: 532
Далее, для более точного анализа, нужно использовать сравнения один-к-одному.
На Gedmatch есть возможность сравнить:
Free Tools -> One-to-One Autosomal DNA Comparison (сравнение один-к-одному по аутосомам)
Free Tools -> One-to-One X-DNA Comparison (сравнение один-к-одному по половой X-хромосоме)

Если идет сравнение с близкими родственниками, имеет смысл ставить опцию "Prevent Hard Breaks (default is to create hard breaks when distance between SNP's exceeds 500,000 base positions)"

Я сравнил свой тест с тестом матери и отца. Наглядно видно, что целая хромосома приходит от отца и целая хромосома приходит от матери.
На рисунке показан совмещенный рисунок обеих сравнений меня с матерью.
Синяя полоска означает совпадение с большой вероятностью.

Прикрепленный файл: I_mother_graph.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Лайк (2)
← Назад    Вперед →Страницы: 1 * 2 3 4 Вперед →
Модератор: tmaua
Генеалогический форум » Дневники участников » Дневники участников » Дневник Tmaua » ДНК. Хромосома. Ген. Наследственность. Простыми словами. [тема №123655]
Вверх ⇈