Древо Жизни
Программа для Windows и Mac. До 40 персон бесплатна, если более, то необходимо купить лицензию
ixes Сообщений: 2655 На сайте с 2010 г. Рейтинг: 1290
| Наверх ##
16 июня 2024 14:09 Elena Polyanskikh Тогда как предложение для версии 6) | | |
Fert г. Москва Сообщений: 4907 На сайте с 2003 г. Рейтинг: 4935
| Наверх ##
16 июня 2024 16:50 king написал: [q] Владимир Иванов написал:
[q] Ведь часто мы имеем неточные/неверные/ошибочные дату и место рождения и даже отчество. Программа "тупая", ей нужно точное совпадение.
[/q]
Ну хотя бы точные совпадения найти было бы хорошо Неточные программным способом действительно идентифицировать не получится, но вот проанализировать некие найденные варианты дополнительно вполне реально. Условно говоря в браке у нас возраст - соответственно есть диапазон годов рождения, и есть дата рождения у конкретных родителей. От этого уже можно будет отталкиваться.[/q]
Я делаю так. Выгружаю базу (около 20000 персон) в ексель: имя, отчество, дата, место рождения и что хотите. Заранее создал файл унификации имен и отчеств, где каждому имени и каждому отчеству поставил в соответствие одно. (400 имен и 1000 отчеств) Например, Семенович, Симонович, Сименович, Семенов, Симонов, Сименов и пр. --- ставлю в соответствие Семенов. Далее делаю замену в выгруженном файле. Сортирую по имени, отчеству. И анализирую группы совпавших имен-отчеств. | | Лайк (5) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 17:33 16 июня 2024 17:35 Fert написал: [q] Я делаю так. Выгружаю базу (около 20000 персон) в ексель: имя, отчество, дата, место рождения и что хотите. Заранее создал файл унификации имен и отчеств, где каждому имени и каждому отчеству поставил в соответствие одно. (400 имен и 1000 отчеств) Например, Семенович, Симонович, Сименович, Семенов, Симонов, Сименов и пр. --- ставлю в соответствие Семенов. Далее делаю замену в выгруженном файле. Сортирую по имени, отчеству. И анализирую группы совпавших имен-отчеств.[/q]
Это не совсем то, я то я хочу. У меня сейчас идёт период активного наполнения базы, я по 50-100 персон добавляю в день, но этот период скоро закончится. Вот тогда будет время заняться другими вопросами, в том числе и поисками дублей. Я хочу попробовать через стороннее приложение поработать с базой. Не править, а просто анализировать. То есть последовательно каждую персону проверить на наличие дубля Вручную голова опухнет, а так программно может что у меня и получится. А нет так нет. --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | Лайк (1) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 17:36 Elena Polyanskikh А 6 версия будет на Postgres? Её можно будет открыть в каком то просмотрщике? --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | Лайк (1) |
romanvm Россия, г. Ефремов Сообщений: 5368 На сайте с 2014 г. Рейтинг: 3374 | Наверх ##
16 июня 2024 19:32 16 июня 2024 19:37 king написал: [q] А 6 версия будет на Postgres? Её можно будет открыть в каком то просмотрщике?[/q]
В таком случае было бы очень удобно запросами формировать практически любую статистику и не только. --- Вопрошающие, большая просьба - приводите ссылки на документы из общедоступных источников. | | Лайк (1) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
16 июня 2024 20:13 romanvm написал: [q] В таком случае было бы очень удобно запросами формировать практически любую статистику и не только.[/q]
У меня база сбойнула когда, я попытался восстанавливать, и просмотрщик нашёл, но правда более подробно не стал заниматься. А раз уж 5 версия уходит в прошлое, то надо думать о будущем. --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | |
Elena Polyanskikh Новосибирск Сообщений: 667 На сайте с 2008 г. Рейтинг: 653 | Наверх ##
17 июня 2024 9:45 king написал: [q] Я ищу людей, внесённым мной в базу дважды - один раз в качестве ребёнка конкретных родителей, второй раз в качестве супруга определенного человека.
[/q]
Найти дубли довольно легко. Отсортируйте таблицу по полному имени, персоны с одинаковыми именами будут идти один за другим. Понимаю, что просмотреть 2000 строк это не 15 минут, но вполне реализуемо. | | |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
17 июня 2024 10:03 Elena Polyanskikh написал: [q] Понимаю, что просмотреть 2000 строк это не 15 минут, но вполне реализуемо.[/q]
не 2000 а 20000 реально глаза устанут, рассеется внимание и кого-то опять пропустишь --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | Лайк (1) |
Elena Polyanskikh Новосибирск Сообщений: 667 На сайте с 2008 г. Рейтинг: 653 | Наверх ##
17 июня 2024 10:11 17 июня 2024 10:11 king написал: [q] Elena Polyanskikh А 6 версия будет на Postgres? Её можно будет открыть в каком то просмотрщике?[/q]
Нет, SQLite. Можно открыть в просмотрщике, их сотни. | | Лайк (4) |
king Тамбовская область Сообщений: 4241 На сайте с 2007 г. Рейтинг: 3466 | Наверх ##
17 июня 2024 10:23 Elena Polyanskikh написал: [q] Нет, SQLite. Можно открыть в просмотрщике, их сотни.[/q]
Спасибо! Займусь на досуге. --- "Но всё так же ночью снится мне деревня
Отпустить меня не хочет родина моя" | | |
|