Древо Жизни
Программа для Windows и Mac. До 40 персон бесплатна, если более, то необходимо купить лицензию
Владимир ИвановЛюбознательный  Россия, г. Псков Сообщений: 2394 На сайте с 2010 г. Рейтинг: 1373 | Наверх ##
16 июня 2024 10:24 king написал: [q] программным способом выявлять дубли персон... /покусано/ ... В одном случае указаны родители, а во втором - супруг.[/q]
Мне кажется, выловит только часть, и скорее небольшую. Ведь часто мы имеем неточные/неверные/ошибочные дату и место рождения и даже отчество. Программа "тупая", ей нужно точное совпадение. Вот если предусмотреть выбор критериев для сравнения, то возможно получиться увеличить процент отлова. Правда выбирать из найденных совпадений придётся человеку, но это будет на порядки легче. Одним словом, как содержатель аналогичной по объёму базы, поддерживаю этот вопрос к Обществу ДЖ. --- с Уважением, Владимир
Haplogroup I2aY и GENI
Упман Карл Симанс 1868 (Валк,Тирзас)
Дишлер Ильзе Альвина 1844 (Альсвиг)
Лутс Шарлотта Амалия 1870 (Верро,Рогози)
Плауктин Ольга Ивановна 1879 (Балтийский Порт)
Зотоглов Павел Дмитриевич 1881 (Хабаровск) | | Лайк (4) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 11:38 16 июня 2024 11:40 Владимир Иванов написал: [q] Ведь часто мы имеем неточные/неверные/ошибочные дату и место рождения и даже отчество. Программа "тупая", ей нужно точное совпадение.[/q]
Ну хотя бы точные совпадения найти было бы хорошо Неточные программным способом действительно идентифицировать не получится, но вот проанализировать некие найденные варианты дополнительно вполне реально. Условно говоря в браке у нас возраст - соответственно есть диапазон годов рождения, и есть дата рождения у конкретных родителей. От этого уже можно будет отталкиваться. --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | Лайк (1) |
ixes Сообщений: 2655 На сайте с 2010 г. Рейтинг: 1290
| Наверх ##
16 июня 2024 12:05 Elena Polyanskikh Елена добрый день, Возможно ли указание в этом нижнем блоке дат жизни?
 | | |
Elena Polyanskikh Новосибирск Сообщений: 667 На сайте с 2008 г. Рейтинг: 653 | Наверх ##
16 июня 2024 13:55 ixes написал: [q] Elena Polyanskikh Елена добрый день, Возможно ли указание в этом нижнем блоке дат жизни?
[/q]
Здравствуйте! Нет, такой настройки в версии 5 нет. Или это как предложение для версии 6? | | |
ixes Сообщений: 2655 На сайте с 2010 г. Рейтинг: 1290
| Наверх ##
16 июня 2024 14:09 Elena Polyanskikh Тогда как предложение для версии 6) | | |
Fert г. Москва Сообщений: 4906 На сайте с 2003 г. Рейтинг: 4933
| Наверх ##
16 июня 2024 16:50 king написал: [q] Владимир Иванов написал:
[q] Ведь часто мы имеем неточные/неверные/ошибочные дату и место рождения и даже отчество. Программа "тупая", ей нужно точное совпадение.
[/q]
Ну хотя бы точные совпадения найти было бы хорошо Неточные программным способом действительно идентифицировать не получится, но вот проанализировать некие найденные варианты дополнительно вполне реально. Условно говоря в браке у нас возраст - соответственно есть диапазон годов рождения, и есть дата рождения у конкретных родителей. От этого уже можно будет отталкиваться.[/q]
Я делаю так. Выгружаю базу (около 20000 персон) в ексель: имя, отчество, дата, место рождения и что хотите. Заранее создал файл унификации имен и отчеств, где каждому имени и каждому отчеству поставил в соответствие одно. (400 имен и 1000 отчеств) Например, Семенович, Симонович, Сименович, Семенов, Симонов, Сименов и пр. --- ставлю в соответствие Семенов. Далее делаю замену в выгруженном файле. Сортирую по имени, отчеству. И анализирую группы совпавших имен-отчеств. | | Лайк (5) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 17:33 16 июня 2024 17:35 Fert написал: [q] Я делаю так. Выгружаю базу (около 20000 персон) в ексель: имя, отчество, дата, место рождения и что хотите. Заранее создал файл унификации имен и отчеств, где каждому имени и каждому отчеству поставил в соответствие одно. (400 имен и 1000 отчеств) Например, Семенович, Симонович, Сименович, Семенов, Симонов, Сименов и пр. --- ставлю в соответствие Семенов. Далее делаю замену в выгруженном файле. Сортирую по имени, отчеству. И анализирую группы совпавших имен-отчеств.[/q]
Это не совсем то, я то я хочу. У меня сейчас идёт период активного наполнения базы, я по 50-100 персон добавляю в день, но этот период скоро закончится. Вот тогда будет время заняться другими вопросами, в том числе и поисками дублей. Я хочу попробовать через стороннее приложение поработать с базой. Не править, а просто анализировать. То есть последовательно каждую персону проверить на наличие дубля Вручную голова опухнет, а так программно может что у меня и получится. А нет так нет. --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | Лайк (1) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 17:36 Elena Polyanskikh А 6 версия будет на Postgres? Её можно будет открыть в каком то просмотрщике? --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | Лайк (1) |
romanvm Россия, г. Ефремов Сообщений: 5366 На сайте с 2014 г. Рейтинг: 3372 | Наверх ##
16 июня 2024 19:32 16 июня 2024 19:37 king написал: [q] А 6 версия будет на Postgres? Её можно будет открыть в каком то просмотрщике?[/q]
В таком случае было бы очень удобно запросами формировать практически любую статистику и не только. --- Вопрошающие, большая просьба - приводите ссылки на документы из общедоступных источников. | | Лайк (1) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 20:13 romanvm написал: [q] В таком случае было бы очень удобно запросами формировать практически любую статистику и не только.[/q]
У меня база сбойнула когда, я попытался восстанавливать, и просмотрщик нашёл, но правда более подробно не стал заниматься. А раз уж 5 версия уходит в прошлое, то надо думать о будущем. --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | |
|