Генеалогическое дерево для 13 млн человек глубиной в 300 лет
На днях группа ученых представила результаты своего проекта по созданию генеалогического древа для 13 миллионов человек. Период времени, за которое построено дерево, составляет 3 века.
| his-hub Сообщений: 221 На сайте с 2016 г. Рейтинг: 518
| Наверх ##
2 марта 2018 14:36 Для того, чтобы начать работу, команда проекта собрала данные, предоставленные командой ресурса Geni.com. Всего было взято 86 млн записей. Ресурс представляет собой генеалогические данные, загруженные энтузиастами. Они же обслуживают ресурс. Каждая запись содержит набор определенных данных, включая имя человека, его связь с другими людьми из базы данных, а также информация иного характера, включая то, когда человек родился, женился, умер. Сам ресурс тоже анализирует данные по мере своих возможностей. К примеру, он предоставляет данные о родственных связях отдельных пользователей с другими пользователями или людьми, занесёнными в базу. Алгоритмы ресурса постоянно прорабатывают карту связей между отдельными людьми. Благодаря этой базе данных ученые и получили огромную выборку данных, включающих информацию 13 миллионов человек. Все эти люди жили в промежутке времени с 1650 по 2000 года.  Получив всю необходимую информацию, ученые смогли начать анализ миграционных потоков людей за указанный период времени. Кроме того, специалисты начали изучать продолжительность жизни людей разных эпох. Кстати, выявился интересный факт — мужчины чаще женщин выбирались в продолжительные поездки. Иногда они были настолько продолжительными, что человек находил свой конец в стране на другой стороне Земли. Эта разница в мобильности, т.е. возможности путешествовать была очень заметной с 1650 по 1800 годы. Чуть позже ситуация начала несколько исправляться и женщины начали путешествовать не реже мужчин. Выяснилось еще, что чем ближе к нашему времени, тем более удаленными могут быть друг от друга люди, которые женились и даже родили детей. Так, например, в 1800 году женились те люди, кто жил поблизости друг от друга. Имеется в виду непосредственная близость в 19 км. Столетием позже это расстояние увеличилось более, чем в 5 раз, достигнув 100 км. Еще один интересный момент — до 1850 года люди част женились или выходили замуж за родственников (двоюродные и троюродные братья и сестры). С течением времени этот тренд начал постепенно затухать. Ученым удалось также отследить продолжительность жизни тех людей, чьи данные попали в отчет. Как выяснилось, жили наши предки гораздо меньше нас, что было вызвано самыми разными причинами, от тяжелого труда до не менее тяжелой болезни. Проект можно считать значимым прежде всего потому, что ученые смогли получить доступ к базам генетических данных. В дальнейшем их можно изучать еще более тщательно, делая определенные выводы. Результаты исследования пригодятся для многих отраслей науки, о чем и было сказано выше. Полный текст статьи: https://arstechnica.com/scienc...300-years/ | | |
| his-hub Сообщений: 221 На сайте с 2016 г. Рейтинг: 518
| Наверх ##
3 марта 2018 18:16 Mask-13 написал: [q]
Например, есть крайне ценное для меня статистическое наблюдение, ответ на вопрос, который меня очень давно интересует:
From 1650 to about 1800, the average married couple in Europe and North America were fourth cousins
Возможно, и на картинке изображено что-то стоящее внимания. Просто без пояснений читать такие визуализации нельзя. К сожалению, я не читал саму статью, только журналистский пересказ на arstechnica.com. Там есть ссылка на оригинал, но нужно покупать подписку на журнал за $50.[/q]
Вот оригинал статьи из проекта sci-hub, доступный через библиотеку либген: http://sci-hub.tw/http://scien...09/tab-pdf там полно ещё данных на 60 страницах, идущих в приложении к статье - работа велась весьма серьёзной командой с хорошей статистикой. http://science.sciencemag.org/...nis_SM.pdf --- his-hub@ya.ru | | |
frosch Москва Сообщений: 369 На сайте с 2015 г. Рейтинг: 537 | Наверх ##
3 марта 2018 21:50 Я все думала, что меня смущает. Спасибо his-hub, поняла благодаря тексту оригинала: [q] More generally, similar to previous studies (57, 58), our work demonstrates the synergistic power of a collaboration between basic research and consumer genetic genealogy datasets. With ever-growing digitization of humanity and the rise of consumer genetics (59), we believe that such collaborative efforts can be a valuable path to reach the dramatic scale of information needed to address fundamental questions in biomedical research[/q]
Получается, то, что люди делают для себя, ну для себя и возможных родственников, стало инструментом. То есть данные были публичны, но я, например, выкладывая свое древо там, не думала что оно интересно кому-то, кроме меня и ряда однофамильцев. А оказывается, это новая база данных, которую можно и так и сяк использовать. И вот этот факт мне не нравится. Вот он, минус онлайн сервисов. Принудительно сдать ДНК заставить не могут без ордера, а с расчески снять могут при необходимости волос и проанализировать. Так и тут - вроде я не подписывалась на участие в каких-либо "биомедицинских исследованиях", но по факту дав разрешение, несу ответственность и теперь я понимаю, какую. | | |
| kgvista Антарктида Сообщений: 182 На сайте с 2016 г. Рейтинг: 525
| Наверх ##
4 марта 2018 6:45 frosch написал: [q] А оказывается, это новая база данных, которую можно и так и сяк использовать. И вот этот факт мне не нравится. Вот он, минус онлайн сервисов.[/q]
Про geni.com не скажу, а вот на myheritage.com автор древа может через настройки сделать полностью приватным - смотреть древо смогут только те, кого автор пригласил. --- Галичские и Пшеничниковы (Варнавинский у.), Бодуновы и Веригины (Осташков), Нечаевы (Максатиха), Дьяковы и Манаковы (Прилуки Онеж.у.).
Трембачевы (Острогожский у.), Черноволовы (с.Ильинка Оренбургский у.), Пелипенко (х.Нижнетиховский ОВД), Ляпины (Ундол), Лариковы (Карасан), Тубасовы (Крым) | | |
mod970 Сообщений: 937 На сайте с 2008 г. Рейтинг: 401 | Наверх ##
4 марта 2018 11:48 frosch написал: [q] то, что люди делают для себя, ну для себя и возможных родственников, стало инструментом.[/q]
Руководство MyHeritage никогда не скрывало, что смотрит на информацию из деревьев как на их капитал. И поэтому цены на их услуги, бесплатные и платные аккаунты субсидированы компанией, этим они как бы расплачиваются с участниками за то, что они предоставляют им базы данных. Дело в том, что компания была создана учеными Иерусалимского Еврейского Университета, и ученые сразу смотрели не только на деньги , но и на науку. Из личного опыта - во всех нюнсах, с которыи я с ними сталкивалась, они большие законники. И это значит, что они используют анонимные данные, охраняя все личные. Сейчас уже не помню деталей, но их сервера имеют супер мощную защиту как в физическом смысле, так и против кибер-атак. Другое дело, что если мы хотим , чтобы нас нашли неизвестные нам родные, то засекречивать все бесмыссленно. Что именно закрыть ото всех, а что приоткрыть, где это сделть и почему - сугубо личное решение, а не ученых и владельцев платформ. --- Бутлицкий, Либерман, Помус(ш),Торговников, Цоглин. Димант. Вишницкий. Цейтлин. Болотников, Пассовой, Шнейдер. Синицын. Арзамасцев. Ермоленко. Страздын.
| | |
| his-hub Сообщений: 221 На сайте с 2016 г. Рейтинг: 518
| Наверх ##
4 марта 2018 13:15 --- his-hub@ya.ru | | |
frosch Москва Сообщений: 369 На сайте с 2015 г. Рейтинг: 537 | Наверх ##
4 марта 2018 20:57 Насчет того, что они не нарушили закон, согласна. Я скорее о том, что была удивлена своей реакции, вроде хорошо же, серьезное исследование с привлечением любимой темы. Потом покопалась и поняла, что выкладывая, не осознавала что отдаю свою информацию. Ну то есть разница - отдать вещь кому-то в руки, или положить в пустыне, зная что она там нафиг никому не нужна. Вот я думала что положила (ну кому нужны данные о моих предках, кроме возможной далекой родни?), а оказалось что в статистическом плане - нужны. В следующий раз, публикуя что-то, буду это учитывать и решать осознанно.
his-hub
Пиратство это вынужденная мера, потому что закон сильно отстает от технологий... А дальше посмотрим, что будет. Уже сейчас много платформ, позволяющих платить за творчество добровольно, от фанатов - авторам. Насчет науки и пр. конечно сложнее. | | |
G_Spasskaya Москва Сообщений: 7718 На сайте с 2015 г. Рейтинг: 4359 | Наверх ##
4 марта 2018 21:13 frosch написал: [q] И вот этот факт мне не нравится. Вот он, минус онлайн сервисов. [/q]
Есть еще один аспект - следствие этого минуса. О нем писали форумчане в одной из веток: разместили на сайте древо, а его отуда кто-то скопировал, перенес к себе, внес свои правки - и информация, годами собираемая человеком, оказалась почти что "продаваемой" другим человеком. Поэтому лично я выбрала абсолютно оф-лайновую программу для своего древа, но поверьте, родственники все равно находятся - через наш форум, через генеалогические выставки и общение с теми, кто интересуется теми же территориями. kgvista написал: [q] а вот на myheritage.com автор древа может через настройки сделать полностью приватным - смотреть древо смогут только те, кого автор пригласил.[/q]
Это рядовые пользователи не могут смотреть закрытые профили. Но вот могут ли получить такой доступ какие-нибудь ученые, которым интересны статистические выборки - это вопрос... может, и могут, в рамках какого-нибудь сотрудничества. | | |
frosch Москва Сообщений: 369 На сайте с 2015 г. Рейтинг: 537 | Наверх ##
4 марта 2018 21:28 4 марта 2018 21:29 G_Spasskaya написал: [q] Есть еще один аспект - следствие этого минуса. О нем писали форумчане в одной из веток: разместили на сайте древо, а его отуда кто-то скопировал, перенес к себе, внес свои правки - и информация, годами собираемая человеком, оказалась почти что "продаваемой" другим человеком.
[/q]
Кстати насчет копирования без контакта между авторами древ Ancestry.com все время в своих видео предупреждают, что копируя к себе кусок чужого древа, который и ваш тоже по дальней родне, без проверки всех источников скорее всего копируете ошибки... Иногда мелкие, а иногда это вообще не та ветка. Но есть желающие приращивать количество персон, это вот для них. Как по мне, так в чем удовольствие, если сразу получен результат? Гораздо приятнее познакомиться с новым родственником, послушать его историю поиска, во всем разобраться. А если без этого, то и ветка новая не нужна. | | |
mod970 Сообщений: 937 На сайте с 2008 г. Рейтинг: 401 | Наверх ##
5 марта 2018 13:32 G_Spasskaya написал: [q] разместили на сайте древо, а его отуда кто-то скопировал, перенес к себе, внес свои правки - и информация, годами собираемая человеком, оказалась почти что "продаваемой" другим человеком.[/q]
frosch написал: [q] есть желающие приращивать количество персон[/q]
Если речь идет только о датах и местах, то и ладно - пусть копируют и приращивают ))) Глядишь, какая нибудь польза и будет. И статистика мне тоже не мешает и надеюсь, когда-нибудь даже помогать сможет... --- Бутлицкий, Либерман, Помус(ш),Торговников, Цоглин. Димант. Вишницкий. Цейтлин. Болотников, Пассовой, Шнейдер. Синицын. Арзамасцев. Ермоленко. Страздын.
| | |
| Vlad23 Санкт-Петербург Сообщений: 211 На сайте с 2016 г. Рейтинг: 219
| Наверх ##
5 марта 2018 13:53 5 марта 2018 13:54 G_Spasskaya написал: [q] разместили на сайте древо, а его отуда кто-то скопировал, перенес к себе, внес свои правки - и информация, годами собираемая человеком, оказалась почти что "продаваемой" другим человеком.[/q]
Поддерживаю. Вы абсолютно правы! Часть моего древа один раз так срисовали. И главный вопрос - зачем? Никаких родственных связей нет. Я не понимаю таких энтузиастов, которым лишь бы базы набить. Для кого все это делается? Ну найдет человек своих родственников через Geni, обратится к разместителю древа, а дальше то что? Человек разместивший чужое древо только ручками разведет. Не знаю мол ничего, срисовал просто и все, ничем помочь не могу. Та же ситуация с многочисленными пустышками. Когда информация из интернета в тупую набивается в Geni. Например, берется база репрессированных, вносится оттуда человек, добавляется его отец, с безумным (по умолчанию) диапазоном дат рождения, по которому ему могло бы быть от 5 до 90 лет на момент рождения сына  И в общем-то на этом древо из двух человек заканчивается. Те, кого и так можно найти в интернете в куче разных баз, в Geni становятся просто информационным мусором, на который кликаешь сто раз, в поисках нужной фамилии, в очередной раз видишь пустышку, злишься и закрываешь. | | |
|