Воссоздание ДНК умершего предка на базе аутосомальных тестов его потомков.Коллеги, у меня стоит задача найти место исхода на Кубань из Украины моего прадеда:
Харченко Пантелей Трофимович, 1908 гр.В условиях нулевой сохранности как метрик, так и записей ЗАГС в месте его проживания на Кубани с 1922 по 1965 год - ДНК генеалогия остается единственным путем для выхода на родовое гнездо.
Имея на руках нижеуказанный объем данных,
задумал исследовать возможность создания искусственно скомбинированного нового набора данных аутосомальной ДНК, который будет содержать максимальное количество данных, относящихся именно к искомому человеку.
Наличие такого набора данных на руках, подгруженного в базы данных MyHeritage, GedMatch, etc - позволит выявить совпаденцев с максимально длинными общими цепочками ДНК = ближайших к прадеду потомков родственников из места, где он родился.
Что мы имеем на сегодняшний день?- BIG Y - тест по линии Харченко, гаплогруппа R-Y55469
- Два аутосомальных теста внуков Харченко П. Т. по разным детям - Вера 1930, Алексей 1928 (обведены синим на фрагменте древа)
- Два аутосомальных теста внуков Троян А.Г. по разным детям - Александр 1915, Нина 1931 (обведены фиолетовым на фрагменте древа) - сделанные с целью отсекать ДНК совпаденцев по ветке Троян-Нелины для проведения исследований по месту исхода/рождения Харченко П.Т.
- Все тесты подгружены во все значимые базы данных ДНК (за исключением 23andMe)[/li]
- За два года работы не обнаружено совпаденцев с длиной общей цепочки ДНК более 30 см, что мы можем отнести к родственникам Харченко П.Т.
Способ предполагаемого построения искуственного набора данных ДНК:1. Взять аутосомальные анализы ДНК у 3 из 5 живых внуков Харченко П.Т., чтоб получить по набору ДНК от внука каждого из 5 детей прадеда.
2. Разместить их в базах данных MyHeritage, после чего:
- выделить в совпаденцах ДНК для этих внуков тех персоналий, кто имеют общие участки ДНК сразу с одним и более других внуков одновременно.
- удалим из выборки тех совпаденцев, у кого места проживания относятся к Кубани, а не Украине и имеют большое число совпаденцев там.
С очень высокой долей вероятности это родственники жены Харченко П.Т., Стасюк Елизаветы Михайловны 1906, коренной казачке с Кубани, а не его. - триангулированные участки совпадающих ДНК - поместить в пространство данных новой искуственной ДНК
- участки ДНК от 6 см длиной, совпадающие у совпаденца с одним из внуков, но не совпадающие у другого для выделенной группы совпаденцев - также помещаем в пространство создаваемой искуственной ДНК.
На этом этапе у нас получится ДНК с подгруженными участками, относящимися только к Харченко П.Т., но с пустыми участками (см визуальный пример такой ДНК на фото из DNA Painter).
.png)
После этого переходим к шагам 3 и 4:
3. Заполняем пустые участки данными аутосомальных ДНК от внуков Харченко П.Г., исключая участки, которые относятся к ДНК родителю не по линии их деда Харченко П.Т.
4. Подгружаем получившийся искусственный образец raw data аутосомальной ДНК в базы базы данных MH, Генотек, GedMatch.
5. Внимательно изучаем родословную/места проживания предков - совпаденцев с этим ДНК профилем, имеющими 50+ см общей ДНК.
В случае успеха - выходим на точное место рождения моего деда.
[!] Готов выслушать Вашу критику такой модели выхода на результат.
[?] Позволю
спросить Вас, знаете ли вы инструмент или специалиста, компанию, с помощью которых можно было бы синтезировать описанный искусственный ДНК профиль прадеда на основе данных из аутосомальных тестов его потомков