Family Finder
аутосомный тест на ФТДНА / FTDNA
liraW Новичок
Сообщений: 26 На сайте с 2016 г. Рейтинг: 26 | Наверх ##
21 августа 2020 17:20 Тампио написал: [q] "Этническое происхождение" на самом деле показывает популяции, к которым относятся люди, имеющие с тестируемым какое-то количество общей ДНК и может не иметь отношения к месту рождения общего предка (предков). Эти популяции определяются самой лабораторией исходя из количества протестированных.[/q]
Правильно ли я понимаю, что в таком случае даже если кол-во протестированных в России, Украине, Беларуси превысит 500, 700 тыс.чел. мы все равно не узнаем узкий ареал проживания наших предков. Ввиду того, что 20 век не хило так всех перемешал (революция, гражданская война, ВОВ, эвакуации, активное перемещение лиц после войны). И даже сейчас, не ввожу ли я в заблуждение лабораторию. отправляя кит моей бабушки из Польши, а не оттуда где она живет? --- Масловы из Белгородской обл до 1940г | | |
Misslipa Таллин Сообщений: 172 На сайте с 2020 г. Рейтинг: 106 | Наверх ##
21 августа 2020 21:28 Вообще-то алгоритм высчитывает этнические проценты, используя отдельную выборку, куда входят только те люди, которые имеют документированное подтверждение того, что по всем линиям предки проживали примерно в одном и том же месте. Насколько далеко в прошлое смотрят предков и насколько широко это "одно и то же место", зависит от компании. Если вы посылает свой кит, то ваш результат автоматически НЕ идет дальше в тренировочные данные, поскольку ваше место проживание совершенно ничего не говорит о вашем происхождении. Ваше этническое происхождение компании неизвестно, для вас оно всего лишь дает оценку. | | |
Тампио«Спасибо» и лайки не надо. Просто нажмите [+]  Санкт-Петербург Сообщений: 1791 На сайте с 2006 г. Рейтинг: 1153 | Наверх ##
21 августа 2020 22:11 21 августа 2020 22:21 liraW написал: [q] Происхождение - 99% Восточная Европа.[/q]
Вангую, что оставшийся процент будет South Central Asia или South America. :-/ liraW написал: [q] даже если кол-во протестированных в России, Украине, Беларуси превысит 500, 700 тыс.чел. мы все равно не узнаем узкий ареал проживания наших предков.[/q] 1) Ареал обитания предков покажет кропотливая работа в архивах. К сожалению, дальше 17 века не смогут копнуть 99,5% исследователей... по объективным причинам, конечно, — исторических статистических документов не сохранилось. Да и не особенно активно 500 лет назад делали перепись населения в России. Скорее, очень и очень выборочно. 2) В FTDNA, к примеру, предлагают указать самого раннего предка по прямой мужской линии и самого раннего предка — по прямой женской. Следовательно, отсекаются 2 предка из 4 в третьем поколении и 6 из 8 в четвёртом. Т.о. современные коммерческие лаборатории этими предками не интересуются. Допустим, вы знаете места жительства этих двух предков в четвёртом поколении по прямым линиям. Если они жили на одной территории, то лаборатория может посчитать результат вашего теста за типичный и включит его в список подобных типичных результатов. Последующие тесты других людей будут сравниваться с тестами из этого списка и уже определять "этническую принадлежность". Но вся беда в том, что никто не учитывает места жительства других 6 предков (из 8). Они могли жить где угодно, но часть их ДНК будет приплюсовано к тому региону, откуда родом патрилинейный и матрилинейный предки. Я вижу, что это уже проблема для выяснения узкого ареала проживания наших предков. Возможно, что лаборатории имеют какие-то алгоритмы для отсеивания. Возможно. Но эти алгоритмы могут основываться на допущениях. Например я читал, что если у большого количества генетических совпаденцев имеется какой-то общий отрезок ДНК, то он не учитывается, поскольку объявляется " генетическим шумом". Но так ли это? Конечно, я размышляю по-дилетантски... надеюсь, что меня поправят профессионалы. 3) Ну и как вишенка на торте — большинство людей слабо представляют даже места рождения своих бабушек и дедушек. Вполне возможно, что их родители (прабабушки/дедушки) на самом деле проживали в других местах. Поэтому, доверять на 100% информации, которую пишут люди о своих матрилинейных/патрилинейных предках, нельзя. Но эта информация используется для определения "этничности" (или популяции) предков. Поэтому, очень большие ареалы, которые показывают для Восточной Европы — это оправданное решение. Misslipa написал: [q] Вообще-то алгоритм высчитывает этнические проценты, используя отдельную выборку, куда входят только те люди, которые имеют документированное подтверждение того, что по всем линиям предки проживали примерно в одном и том же месте. [/q]
В том-то и дело, что нет. Покажите мне, как эту выборку делает ФТДНА " по всем линиям предков, проживавшим примерно в одном и том же месте". В какие строки/графы эта информация записывается?
 --- Новг. обл, Маловишерский р-н, д. Поддубье, Горнецкое, Селищи — ЕВПЛОВЫ ИВАНОВЫ
Кировск. обл, Лузский р-н, д. Пятинская — ИГУМНОВЫ
Тамб. обл, Гавриловский р-н — ТЕРЁШКИНЫ ВОЛЧКОВЫ
Белоруссия: Бобруйск, Новогрудок — ПОТАПОВИЧИ ОСИПОВИЧИ
☦ Финны СПб ☦ | | |
Misslipa Таллин Сообщений: 172 На сайте с 2020 г. Рейтинг: 106 | Наверх ##
21 августа 2020 22:39 | | |
Тампио«Спасибо» и лайки не надо. Просто нажмите [+]  Санкт-Петербург Сообщений: 1791 На сайте с 2006 г. Рейтинг: 1153 | Наверх ##
22 августа 2020 9:24 22 августа 2020 22:21 Misslipa написал: [q] Не уверена вообще, что референсный массив данных FTDNA из числа пользователей сайта берет.[/q]
А откуда? Типа всемирная база типичных/референсных данных? Кто её составляет и бесплатно выкладывает для коммерческого использования? Я не могу представить такую ситуацию в капиталистическом обществе, где всё патентуется и скрывается, защищается авторским правом. Опять-таки, я рассуждаю с позиции обывателя. Но мне трудно понять для чего надо давать базу другим, а не быть монополистом. Монополия — это то, к чему стремится бизнес. Misslipa написал: [q] Здесь на примере 23andMe достаточно интересно описан процесс:[/q]
Там не написано что это за база. Для 23andme не составит труда сделать самим такую базу... с их-то несколько миллионной базой пользователей. Ну и интересен другой вопрос: почему разные лаборатории оперируют разными популяциями если база, якобы, — одна? Вот популяции от ФТДНА: Sephardic Ashkenazi North and Central America South America British Isles Scandinavia Finland West and Central Europe Southeast Europe East Europe Iberia West Middle East East Middle East Asia Minor North Africa East Central Africa South Central Africa West Africa Central Asia South Central Asia Siberia Northeast Asia Southeast Asia Oceania Вот популяции у майхеритаж по Восточной Европе, которых нет у ФТДНА: East Europe: East European Baltic Balkan Если есть единая база, то почему у ФТДНА нет "балтов" и "балканцев"? --- Новг. обл, Маловишерский р-н, д. Поддубье, Горнецкое, Селищи — ЕВПЛОВЫ ИВАНОВЫ
Кировск. обл, Лузский р-н, д. Пятинская — ИГУМНОВЫ
Тамб. обл, Гавриловский р-н — ТЕРЁШКИНЫ ВОЛЧКОВЫ
Белоруссия: Бобруйск, Новогрудок — ПОТАПОВИЧИ ОСИПОВИЧИ
☦ Финны СПб ☦ | | |
Misslipa Таллин Сообщений: 172 На сайте с 2020 г. Рейтинг: 106 | Наверх ##
23 августа 2020 0:17 Тампио написал: [q] [/q]
Стандартная ситуация в анализе данных: дашь разным аналитикам одни и те же данные и они построят разные модели и соответственно сделают разные прогнозы. Почему? Потому что анализ данных - это скорее искусство, чем наука. Очень много допущений и предположений приходится делать. Даже если предположить, что у всех компаний идентичная изначальная база, то каждый аналитик в каждой фирме принимает отличное от другого аналитика решение, основываясь на своих верованиях и знаниях. Например. В FTDNA аналитики не верят, что 10000 человек якобы родом с Балкан, 10000 человек якобы родом из Прибалтики и еще 10000 человек родом из Восточной Европы - достаточная выборка для того, чтобы делать более детальные прогнозы. Поэтому FTDNA на всякий случай выдает общий ответ «Восточная Европа», боясь вдаваться в детали и таким образом дать «ложнопозитивный» ответ. А вот аналитики в MyHeritage более уверенные и рисковые. Они не сомневаются, что выборки в 10000 с каждого подрегиона хватит с лихвой, чтобы дать точный ответ. Причем обе компании смогут при необходимости статистически и убедительно обосновать свое решение. | | |
Тампио«Спасибо» и лайки не надо. Просто нажмите [+]  Санкт-Петербург Сообщений: 1791 На сайте с 2006 г. Рейтинг: 1153 | Наверх ##
23 августа 2020 2:55 23 августа 2020 2:55 Misslipa написал: [q] то каждый аналитик в каждой фирме принимает отличное от другого аналитика решение[/q]
Я думаю. что вы идеализируете ситуацию. Никто там никуда не смотрит, скорее всего. Системы работают на алгоритмах и человек там не нужен. Это как роботы на биржах — они анализируют ситуацию лучше людей, поскольку не подвержены азарту. Как я вижу, вы меня так и не поняли. Повторюсь: можно было бы свалить всё на "аналитиков", если бы не одно большое НО: популяции (или как их называют большинство людей, не очень хорошо понимающих, что такое ДНК, — этническое происхождение) у разных лабораторий разные. Если ФТДНА имеет лишь одну популяцию "восточноевропейцы", то другие лаборатории высматривают дополнительно "балтов" и "балканцев". Мой тест: Майхеритаж даёт: East Europe 72.5% (East European 49.4%, Baltic 23.1%) ФТДНА: East Europe 74% Мой отец: Майхеритаж: East Europe 77.4% ФТДНА: East Europe 67% Моя мать: Майхеритаж: East Europe 72.3% (Baltic 49.2%, East European 23.1%) ФТДНА: East Europe 75% Если мы верим словам о какой-то общей референсной базе данных, то придётся признать, что ФТДНА объединило в моих случаях "балтов" и "восточноевропейцев". Я не верю в это, ибо зачем из двух баз данных делать одну? Более того, мы видим, что нет совпадений в процентовке "восточноевропейцев" (даже если предположить, что в них включили "балтов"). Если база одна, то и проценты должны быть довольно близки. А если посмотреть на минорные популяции, то там вообще кто в лес, кто по дрова — расхождения не только по процентам, но и по ареалам обитания. Мой вывод: нет никакой общей базы референсных образцов, а есть свои базы, которые лаборатории обрабатывают своими уникальными алгоритмами (и это мы ещё не упомянули чипы). --- Новг. обл, Маловишерский р-н, д. Поддубье, Горнецкое, Селищи — ЕВПЛОВЫ ИВАНОВЫ
Кировск. обл, Лузский р-н, д. Пятинская — ИГУМНОВЫ
Тамб. обл, Гавриловский р-н — ТЕРЁШКИНЫ ВОЛЧКОВЫ
Белоруссия: Бобруйск, Новогрудок — ПОТАПОВИЧИ ОСИПОВИЧИ
☦ Финны СПб ☦ | | |
Misslipa Таллин Сообщений: 172 На сайте с 2020 г. Рейтинг: 106 | Наверх ##
23 августа 2020 11:26 23 августа 2020 11:37 Тампио написал: [q] [/q]
во-первых, алгоритмы не сами себя создали, а их люди писали. во-вторых, к сожалению, это вы не поняли то, что я написала в предыдущем сообщении. Одинаковые исходные данные не являются гарантом одинаковых результатов. FTDNA может тоже "видеть" Балканы, но по статистическим соображениям не отображать их. Но если вам так удобнее, можете предполагать, что у FTDNA намного меньше выборка, чем у MyHeritage  Это тоже не исключено, я просто пыталась объяснить вам, почему это совсем не факт. Наверное я плохо объясняю. Но можно погуглить и найти более умные пояснения. Farrer adds, even if the two companies were using the same reference sample, there may still be discrepancies. “The algorithms they apply to correlate the signatures derived from one population may be different from the way another company does it. One isn’t necessarily wrong or less reliable than the other, but just shows the limits of the precision in some of the estimates,” said Farrer. https://www.nbcboston.com/news...es/125109/ | | |
Тампио«Спасибо» и лайки не надо. Просто нажмите [+]  Санкт-Петербург Сообщений: 1791 На сайте с 2006 г. Рейтинг: 1153 | Наверх ##
23 августа 2020 20:23 23 августа 2020 20:27 Misslipa написал: [q] Одинаковые исходные данные не являются гарантом одинаковых результатов.[/q]
Я не утверждал, что результаты должны быть одинаковые. Я написал вполне определённо: "Если база одна, то и проценты должны быть довольно близки." Misslipa написал: [q] Farrer adds, even if the two companies were using the same reference sample, there may still be discrepancies.[/q]
Если одна лаборатория по тесту одного человека показывает южных европейцев (Италия и Греция), а другая по этому же тесту — иберийцев (Испания и Португалия), то я не вижу причин думать об общей базе данных. Такие различия не списать на алгоритмы. Ну а если вам хочется это сделать, то тогда зачем вообще нужны такие результаты теста ДНК, в которых может быть что угодно? То, что одинаковые исходные данные не являются гарантом одинаковых результатов, на форуме molgen.org продемонстрировал один из участников, который сделал в одной лаборатории два теста своей ДНК. Результаты отличались на процент или два, но это всё-таки различие. Я думаю, что нашу дискуссию следует закончить до тех пор, пока не появятся факты (подтверждающие или отрицающие) идею об общей базе данных. Пока же таких фактов я не знаю. А вы только предполагаете, что она существует. --- Новг. обл, Маловишерский р-н, д. Поддубье, Горнецкое, Селищи — ЕВПЛОВЫ ИВАНОВЫ
Кировск. обл, Лузский р-н, д. Пятинская — ИГУМНОВЫ
Тамб. обл, Гавриловский р-н — ТЕРЁШКИНЫ ВОЛЧКОВЫ
Белоруссия: Бобруйск, Новогрудок — ПОТАПОВИЧИ ОСИПОВИЧИ
☦ Финны СПб ☦ | | |
Daria1 Сообщений: 138 На сайте с 2016 г. Рейтинг: 180 | Наверх ##
18 сентября 2020 21:16 Будьте внимательны! На сайте FamilyTreeDNA при составлении своего дерева, если давно умершему предку не поставить галочку в окошке, что он умер, то этот предок никому показываться не будет. Я была очень довольна своим составленным древом, пока случайно не посмотрела на него с чужой страницы. Предок умер в 1834 году. Я не поставила галочку, и люди вместо информации о нем видят слово Private. --- Хитро, Манюк, Молочко, Костюк (Вселюб Новогрудского уезда Минской губернии)
Сопин, Канин, Долгарев (Грайворонский уезд Курской губернии)
Быстрый, Быстров, Вовк (Ставропольский край+Северный Кавказ)
Цыганов (Самара) | | |
|