Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

ДНК-генеалогия. Вопросы новичков

И ответы опытных ))

    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 361 362 363 364  365 366 367 368 369 ... 452 453 454 455 456 457 Вперед →
Модераторы: Lesla, kbg_dnepr, Andrey Maslennikov
Evgeny Kolchugin

Evgeny Kolchugin

Московская обл.
Сообщений: 866
На сайте с 2013 г.
Рейтинг: 969

yakto написал:
[q]
Новичкам важно понимать, что совпадения в cM - это не длина идентичных участков нуклеотидных последовательностей, а оценка вероятности их совпадения на определенном участке последовательности.
[/q]

По смыслу это верно. Но только не вероятность совпадения, а наоборот, вероятность разделения общего совпадающего участка (имеющего одинаковую последовательностью нуклеотидов) при передаче следующему поколению.

В организме человека один сантиморган соответствует примерно одной мегабазе (одному миллиону пар оснований). Но эта вероятность зависит от сцепленности нуклеотидов в разных участках хромосомы. Поэтому более короткие участки могут иметь бОльшую оценку в сМ (при малой сцепленности), и наоборот.
---
Жизнь каждого человека достойна романа. /Ирвин Польстер/
kolchugin-story.ru
Пенза: Кольчугины, Мельниковы, Мирясовы, Дудниковы, Мурзины, Зименковы, Курдюковы, Голеневы, Школьниковы, Финогеновы
Калужская губ.: Прошины, Грешновы (Гришновы), Губановы, Романовы, Кузьмины(?), Коршуновы, Барковы
tmaua

tmaua

Киев
Сообщений: 955
На сайте с 2021 г.
Рейтинг: 468

Evgeny Kolchugin написал:
[q]
Но эта вероятность зависит от сцепленности нуклеотидов в разных участках хромосомы. Поэтому более короткие участки могут иметь бОльшую оценку в сМ (при малой сцепленности), и наоборот.
[/q]

Гедматч когда рисует картинку, некоторые широкие куски (желтый) по сМ идентичны маленьким (зеленым).
Я думал, это по причине большего кол. совпавших SNP так происходит. Или такая прорисовка как-раз и вызвана меньшей сцепленностью нуклеотидов в зелененьких кусках?

Прикрепленный файл: сМ.jpg
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Tulimov
Новичок

Сообщений: 20
На сайте с 2006 г.
Рейтинг: 18
Уважаемые Гуру!
Видимо лабораториям уже необходимо всем вам доплачивать! Я еще не дождался получения своих результатов, а мне уже страшно в них смотреть и ощущение полной бесполезности данного мероприятия biggrin1.gif
Огромнейшая просьба, с учетом того, что беседа ведется в разделе "вопросы новичков", нельзя ли как-то, по возможности и в обязательном порядке без таковой, пояснять употребляемые сложновыговариваемые (обнажаю это слово) термины общедоступными комментариями 101.gif
Так сказать, все писать именно, как для чайников!

Я понимал, что будет не легко, но не настолько же biggrin1.gif
Дайте мне обнять лицо того человека, который втянул меня в эту аферу! biggrin1.gif
---
Тулимовы, Бахтины, Каштыловы, Сахины, Лобановы, Батовы (Ярославская обл., Костромская обл.), Лебедевы (предположительно Калининская обл. по состоянию на 1941 год)
Лайк (2)
Evgeny Kolchugin

Evgeny Kolchugin

Московская обл.
Сообщений: 866
На сайте с 2013 г.
Рейтинг: 969

tmaua написал:
[q]
Гедматч когда рисует картинку, некоторые широкие куски (желтый) по сМ идентичны маленьким (зеленым).
Я думал, это по причине большего кол. совпавших SNP так происходит. Или такая прорисовка как-раз и вызвана меньшей сцепленностью нуклеотидов в зелененьких кусках?
[/q]

Я думаю, последнее объяснение. Физически они разной длины. Там и количество снипов, указанное для желтого и зеленых фрагментов, сильно различается.
---
Жизнь каждого человека достойна романа. /Ирвин Польстер/
kolchugin-story.ru
Пенза: Кольчугины, Мельниковы, Мирясовы, Дудниковы, Мурзины, Зименковы, Курдюковы, Голеневы, Школьниковы, Финогеновы
Калужская губ.: Прошины, Грешновы (Гришновы), Губановы, Романовы, Кузьмины(?), Коршуновы, Барковы
Evgeny Kolchugin

Evgeny Kolchugin

Московская обл.
Сообщений: 866
На сайте с 2013 г.
Рейтинг: 969

Tulimov написал:
[q]
Огромнейшая просьба, с учетом того, что беседа ведется в разделе "вопросы новичков", нельзя ли как-то, по возможности и в обязательном порядке без таковой, пояснять употребляемые сложновыговариваемые (обнажаю это слово) термины общедоступными комментариями
Так сказать, все писать именно, как для чайников!
[/q]

Не беспокойтесь, привыкнете, перестанете обращать внимание. Лично я до сих пор не уверен, что сам понимаю то, о чем говорю. И вы скоро научитесь. biggrin1.gif

В моем понимании, участок длиной 1 сМ означает 1% вероятности того, что это участок разделится (или мог разделиться ранее) при передаче по наследству в течение одного поколения. То есть (средняя) вероятность существования этого участка в неизменном виде - 100 поколений. Соответственно, 10 сМ - 10 поколений, 20 сМ - 5 поколений.

Общее количество сМ при близком родстве гораздо больше 100. Это объясняется большим количеством совпадающих участков хромосом и тем, что вероятность разделения оценивается для каждого из них индивидуально, а потом результаты просто суммируются. Существуют таблицы, показывающие ориентировочное общее количество сМ при разных степенях родства.

---
Жизнь каждого человека достойна романа. /Ирвин Польстер/
kolchugin-story.ru
Пенза: Кольчугины, Мельниковы, Мирясовы, Дудниковы, Мурзины, Зименковы, Курдюковы, Голеневы, Школьниковы, Финогеновы
Калужская губ.: Прошины, Грешновы (Гришновы), Губановы, Романовы, Кузьмины(?), Коршуновы, Барковы
yakto

yakto

Глубокая провинция
Сообщений: 325
На сайте с 2015 г.
Рейтинг: 208

Evgeny Kolchugin написал:
[q]
участок длиной 1 сМ
[/q]

Уже пояснял выше biggrin1.gif Сантиморган - не единица измерения длины, а единица измерения вероятности кроссинговера на участке ДНК-последовательности между двумя локусами. Если хотите, упрощенно, расстояние между двумя кроссинговерами на участке генома.

Когда вы делаете аутосомный тест ДНК, определяется не вся нуклеотидная последовательность вашего генома (как при полном секвенировании), а только отдельных локусов - SNP (Single Nucleotide Polymorphism, последовательности ДНК размером в один нуклеотид:A, T, G, C). Типовой тест включает в себя набор около 600 тыс. SNP.

А вот на дистанции между двумя локусами предполагается, что вероятность кроссинговера составляет не более 1%. То есть мы не знаем наверняка, но вероятность такая (1 сМ).
Так как вероятность определяется на участке между локусами, она коррелирует с физической дистанцией в количестве нп, но не является расстоянием или длиной. На разных участках генома сантиморган может охватывать последовательности в разном количестве.

Чем больше локусов (SNP) совпадает, тем больше оценка вероятности в сМ и фактическая вероятность того, что сравниваемый участок генома имеет общего предка.

Это все очень упрощенно, для общего представления.

Следует отметить также, что у MH и FTDNA алгоритмы приведения к единой единице измерения существенно отличаются, поэтому оценки для двух сравниваемых образцов ДНК отличаются. Например, MH говорит о совпадении в 11 сМ, а FTDNA - 15 сМ. В хромосомных браузерах можно увидеть, что даже сегменты хромосом отличаются. Кому верить - право выбора за вами. В любом случае, это вероятностная оценка. И в случае маленьких совпадений - маловероятностная. О чем уже говорилось выше.

Чтобы стало еще понятней: на участках между известными локусами (SNP) мы теоретически достраиваем последовательность ДНК, предполагая, что она в большинстве случаев неизменна. И таким образом получаем гипотетический полный сиквенс генома. Дешево и сердито.
a_003.gif

В дополнение, локусы SNP еще иногда называют маркерами. В нашем случае, маркируются самые полиморфные (изменчивые) участки генома. Значения маркеров сравниваются лабораторией-тестировщиком. Технически этого достаточно для установления близкого родства, с дальним - как повезет. Все остальные няшки в виде сМ и хромосомных браузеров только для внятной визуализации и привлечения нового клиента. Мы же, как взрослые люди, понимаем, что это далеко не реальность.


tmaua написал:
[q]
Гедматч когда рисует картинку, некоторые широкие куски (желтый) по сМ идентичны маленьким (зеленым).
[/q]

Вот кстати, на скриншоте tmaua видно, что участки разного размера, а оценка в сМ почти одинаковая. Несоразмерность указывает на сомнительный результат совпадения или завышенный в оценке совпадения. Гедматч подсветил участок желтым (не называя сомнительным, а называя наполовину совпадением biggrin1.gif ).
---
Фамилии: Колесниковы, Ефановы (с.Донское), Долейш (Чехия), Малеевы (Мартыновка), Косаревы-Косыревы (Карс, США, Самара, Кавказ), Назаровы (х.Скельновский), Коноза, Солодовник (Кризское), Нефедовы (Никулино), Лиховские (Рост. обл.) ТГ:@aleksan_sergeevich
Лайк (3)
tmaua

tmaua

Киев
Сообщений: 955
На сайте с 2021 г.
Рейтинг: 468

yakto написал:
[q]

Вот кстати, на скриншоте tmaua видно, что участки разного размера, а оценка в сМ почти одинаковая. Несоразмерность указывает на сомнительный результат совпадения или завышенный в оценке совпадения. Гедматч подсветил участок желтым (не называя сомнительным, а называя наполовину совпадением biggrin1.gif ).
[/q]


Если рассмотреть детальнее желтый и первый зеленый кусочек, оба имеющие +- 7 сМ, то получим такую картину.
Самому хотелось бы четко и однозначтно понять эту картинку.
1 - исходная картинка (тут зеленый и желный цвет не указывают ни на что, просто цвет)
2 - детальная картинка для желкого кусочка
3 - детальная картинка для первого зеленого кусочка


Пока я ее трактую так:
"Желтый кусочек очень длинный, но в нем очень маленькая плотность SNP (т.е. мало SNP есть в этом кусочке).
В желтом кусочке на всей его длинне (с 37М по 74М) найдено 576 совпавших SNP.
Гедматч используя матаппарат поставил такому желтому кусочку значение Q-value=162.

Первый зеленый кусочек очень короткий, но в нем приличная плотность SNP (т.е. много SNP есть в этом кусочке).
В зеленом кусочке на всей его длинне (с 136М по 137М) найдено 215 совпавших SNP.
Гедматч используя матаппарат поставил такому зеленому кусочку значение Q-value=33.

Т.е. гедматч считает более вероятностным правильность желтого кусочка. "

Ваши мнения?

Прикрепленный файл: плотность_ДНК.png
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
Evgeny Kolchugin

Evgeny Kolchugin

Московская обл.
Сообщений: 866
На сайте с 2013 г.
Рейтинг: 969
yakto, блестящее объяснение! Лично я, поломав голову над темой, оставил попытки детального изучения механизма оценки результатов и полагаюсь на выводы лаборатории. Для близкого родства их мнение достаточно надежно, а для дальнего - не очень-то и нужно))

На самом деле, методика оценки - это огромная научная тема. Взять хотя бы тот факт, что все аутосомы парные. Поэтому совпадение каждого маркера может иметься как по одной, так и по двум хромосомам в паре. А учитывая, что маркеров сотни тысяч... В общем, бой в Крыму, всё в дыму. biggrin1.gif
---
Жизнь каждого человека достойна романа. /Ирвин Польстер/
kolchugin-story.ru
Пенза: Кольчугины, Мельниковы, Мирясовы, Дудниковы, Мурзины, Зименковы, Курдюковы, Голеневы, Школьниковы, Финогеновы
Калужская губ.: Прошины, Грешновы (Гришновы), Губановы, Романовы, Кузьмины(?), Коршуновы, Барковы
yakto

yakto

Глубокая провинция
Сообщений: 325
На сайте с 2015 г.
Рейтинг: 208

tmaua написал:
[q]
Т.е. гедматч считает более вероятностным правильность желтого кусочка.
[/q]

Зачем вам эти дебри?
SNP Density не дает вам никакой практической информации, кроме того, что на малом участке хромосомы расположено больше локусов.
Количество SNP - это не количество совпаших локусов, а количество участвующих в сравнении.
Q-value - это математически рассчитанная вероятность верности совпадения. Логично, что при большем количестве локусов в сравнении (даже с меньшим количеством соответствия) - величина будет больше. Чем больше мы сравнили, тем больше вероятность, что сравнили правильно. Тоже бесполезный показатель.

Gedmatch - всего лишь инструмент для визуализации результатов вашего теста в сравнении с другими. Он парсит ваш ROW-файл, загоняет в базу данных, а дальше работают формулы. То же самое вы можете сделать самостоятельно, имея на руках несколько результатов.

Ваши вопросы должны быть ближе к поверхности. Что вы хотите увидеть?

У вас есть маленькое совпадение со всеми тремя персонами. При таком объеме сМ установить родство невозможно, опираясь только на эти результаты.
Родство очень далекое, с общим предком жившим более чем 6-8 поколений назад.
В шестом поколении у вас 64 предка, в 8-ом - 256. Для документального сравнения предков в поиске соответствия нужно открыть всех, что практически нереально.
Только невероятная удача поможет вам установить конкретное родство с этими людьми.
При условии, что вы действительно родственники.
smile_030.gif

P.S. У меня таких родственников около 3 тысяч, у супруги - около 8 тысяч. Такой объем совпадений говорит об очееень дальнем родстве. Когда мы почти все родственники... Или не родственники вовсе, потому что программы ошибаются.
---
Фамилии: Колесниковы, Ефановы (с.Донское), Долейш (Чехия), Малеевы (Мартыновка), Косаревы-Косыревы (Карс, США, Самара, Кавказ), Назаровы (х.Скельновский), Коноза, Солодовник (Кризское), Нефедовы (Никулино), Лиховские (Рост. обл.) ТГ:@aleksan_sergeevich
Лайк (2)
tmaua

tmaua

Киев
Сообщений: 955
На сайте с 2021 г.
Рейтинг: 468

yakto написал:
[q]

Ваши вопросы должны быть ближе к поверхности. Что вы хотите увидеть?

У вас есть маленькое совпадение со всеми тремя персонами. При таком объеме сМ установить родство невозможно, опираясь только на эти результаты.
Родство очень далекое, с общим предком жившим более чем 6-8 поколений назад.
В шестом поколении у вас 64 предка, в 8-ом - 256. Для документального сравнения предков в поиске соответствия нужно открыть всех, что практически нереально.
Только невероятная удача поможет вам установить конкретное родство с этими людьми.
При условии, что вы действительно родственники.


P.S. У меня таких родственников около 3 тысяч, у супруги - около 8 тысяч. Такой объем совпадений говорит об очееень дальнем родстве. Когда мы почти все родственники... Или не родственники вовсе, потому что программы ошибаются.
[/q]

Про дальность родства и сложность его определения по причине удвоения прямых родственников на каждом уровне я согласен.
Хочется полного понимания каждого термина и колонки в таблице чтобы понимать саму суть процесса сравнения. Привык изучать инструмент измерения, а не просто доверять его показаниям. :-)


yakto написал:
[q]

Количество SNP - это не количество совпаших локусов, а количество участвующих в сравнении.
[/q]

Вот, а я почему-то был уверен, что это кол. совпавших SNP. Спасибо за прояснение.


yakto написал:
[q]

SNP Density не дает вам никакой практической информации, кроме того, что на малом участке хромосомы расположено больше локусов.
[/q]

Не раз слышал такую фразу, в моем совпадении 5 сМ больше SNP чем в твоем совпадении 7сМ - поэтому мой кусок 5 сМ может быть более весомым чем твой кусок 7 сМ.
Как можно это прокомментировать?
---
(Кузуб Комендант) - Лепляво
(Пелых Власенко Игнатенко Андрущенко) - Канев
(Губарь Рыбалко Татаренко) - Белополье
(Щенявский Янушевич Соколовский Пионтковский
    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 361 362 363 364  365 366 367 368 369 ... 452 453 454 455 456 457 Вперед →
Модераторы: Lesla, kbg_dnepr, Andrey Maslennikov
Генеалогический форум » Генетическая генеалогия » ДНК-генеалогия » ДНК-генеалогия. Вопросы новичков [тема №49672]
Вверх ⇈