На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Перед тем, как ставить оценку, ознакомьтесь с главной страницей рейтинга архивов, чтобы понять оцениваемые критерии. Оценка 1 - очень плохо, 10 - очень хорошо;
Spirtovich Скачал с Облака, раскрыл архив, запустил, выгрузил одну запись, проверил PDF - все работает.. У Вас или архив не раскрылся с подкаталогом Lib, или JRE не установлено.. По моему больше вариантов нет.. Хотя.. Напишите, если не получится еще раз запустить программу...
Феликс, приветствую! Может немного не в тему (пусть тогда модераторы меня поправят), но вот родилась такая идея:
Иногда человек не знает, откуда точно родом искомая персона, но зато владеет информацией не только о его ФИО (или просто фамилии), но и о ФИО других людей, как то с персоной связанных. Ну, например, сослуживцы, или жена (в предположении, что она из соседней местности) и т.д. Или ещё пример: живут в селе тысячу лет одни и те же носители фамилий, а потом - раз, и пропали. Т.е., скорее всего были переселены сюда (или отсюда). А куда/откуда - неизвестно. Но можно предположить, что переселялись сразу все вместе...
Так вот было бы неплохо в таком случае уметь осуществлять поиск по базам с большим объёмом записей сразу по НЕСКОЛЬКИМ фамилиям (или ФИО)! Не знаю, как там с внутренним механизмом ОБД Мемориал - позволяет она такое проворачивать или нет... Но такую операцию можно было бы осуществить и стандартными средствами: делать промежуточную выгрузку по каждой фамилии, а потом статистически обрабатывать местности в результатах - самым частовстречающимся ставить высший рейтинг на подозрение в местности исхода/прихода...
Идея хорошая, правильная.. Если предыдущая программа - это скорее инструментарий поисковика, подспорье для его аналитической работы по данным ОБД без Инетренета, то поиск по ФИО -это уже более "народная" программа.. НО.. хочу поделиться сомнениями, может в нашем обмене мыслями и родится идея программы.. 1. Выгрузка по ФИО - это увеличение объемов (количества записей) информации в разы, в десятки раз.. 2. Есть ограничение на 9995 записей за один запрос к ОБД.. я его научился обходить перебором ПЕРВОЙ буквы фамилий.. 3. Как быть при фамилии Иванов? Сотни тысяч ..Есть вариант - перебор первой буквы имени, и можно еще год рождения(1890-1925) 4.Предположим - Сделал механизм перебора Фамилия-Первая буква Имени -Год Рождения, (а если даже такой критерий не разобьет информацию на блоки менее 10000 записей ,что делать?) Хорошо, есть механизм перебора (алгоритмически - ничего сложного), в какой среде хранить результаты? Ексель - на одном листе 1'048'576 записей, теоретически в книге листов может быть МНОГО, НО.. работать программа будет по сохранению результатов долго и нудно.. Но это формат 2010 офиса, не у всех еще он используется Access - но как конечный пользователь будет просматривать и анализировать (выборки, фильтры и пр) DBase - dbf файлы. .тоже есть ограничения на объемы записей (от версий зависит DBF) и потом в какой среде с ними работать?
Есть выход из этого тупика (тупик - это на мой взгляд) Сделать программу поиска по ФИО, НО.. с ОБЯЗАТЕЛЬНЫМ заполнением полей - Год Рождения, Место Рождения.. Список обязательных полей - слабое место . .а Место и Дата призыва? а дата выбытия? а место службы? В общем... Нужен коллективный разум.. Жаль счетчик скачиваний не работает.. Не видно - софт скольким людям нужен... Широким массам или узким. .Хотя тот вопрос не главный. .даже ради одного пользователя надо ЭТО делать Одна (две) головы хорошо, но нужно больше мнений..
1) Да, обход ограничения на 9995 в случае очень распространённой фамилии возможен только через доп. поля. Но обходить я его предлагаю именно в специфике обсуждаемой программы - т.е. по краям и областям и другим типам АТД: - делаем выборку по фамилии, если < 10000, то сразу переходим к анализу мест; - если > 10000, то делаем выборку по областям и краям (тут неплохо бы заранее иметь этот список, ну или шерстить названия АТД по буквам); - если даже по области > 10000, то либо а) говорим пользователю "Извини, но с такой распространённостью смысл использования данной программы пропадает!", либо б) принимаем, что в этой области заданных фамилий > 10000 и переходим к анализу, либо в) углубляемся до уровня районов и т.д. А делать обязательным ввод имен и дат - это не для этой задачи... Мы же не конкретного человека ищем, а ареалы распространённости СПИСКА фамилий (тут я задумалься про ЕДИНИЧНУЮ фамилию... надо? нет?).
2) исходя из варианта по п.1, общее кол-во записей вряд ли будет больше 10000 умножить на сотню АТД - это максимум около миллиона на каждую фамилию :( Т.е., либо каждую фамилию на отдельную страницу экселя, либо что-то кроме него. Access - из той же среды, с ним через эксель можно работать в крайнем случае. DBase - . Можно ещё MySQL рассмотреть, как вариант (компактно, бесплатно и т.д.). Опять же, нам для данной задачи не надо сохранять ДЛЯ ПОЛЬЗОВАТЕЛЯ выборку всех записей. Нам надо их ВРЕМЕННО сохранить для последующего анализа (да хоть в массиве в оперативке), проанализировать, а только потом выдать пользователю те из них, которые удовлетворяют условиям задачи - т.е. записи о людях с фамилиями, одновременно встречающимися в одной и той же местности. А их то уж точно не миллион будет
P.S.: если публиковать программу через Я.Диск (там можно сделать публичную ссылку как на конкретный файл, так и на папку), то счётчик у тебя будет
Москва Сообщений: 717 На сайте с 2005 г. Рейтинг: 846
Наверх##19 августа 2014 16:4319 августа 2014 16:44
a-KaDeMi-k Денис.. Пункт 1 не пройдет.. Вернее по ДопПолям можно выгрузить ФИО, но не по АдмТер Делению.. Вот по этой ветке Районы я выкладывал наименования РАЙОНОВ из ОБД.. Написание - много вариантов, сокращения - какие хочешь.. единственное, что в АТД есть твердого для зацепки- это наименования РВК, и Областей.... НО. .Наименование то РВК наименованием,а есть еще РВК|ГВК|РеспВК|ГРВК|ВК|ОВК|ОРВК|ОГВК
Как быть? У меня только один вариант решения - Фамилия + ГодРождения. Вот статистика по двум Фамилиям - Иванов и Поляков - в принципе все реально ..
Но опять же вопросы. .а есть Фамилии без Года Рождения. Есть фамилии искаженные, значит надо вводить маски поиска (*).. А это уже все, результаты будут нечеткими.. Это я вопросы накидываю по памяти, по тому, что сохранилось в голове при поисках.. А ели сесть за анализ ОБД - там все окажется хуже..
А нечёткий поиск по фамилии в данной задаче не нужен. Ну, не попадут в статистическую обработку процентов 5-10 носителей (с ошибками ввода), ну и не особо страшно это. Самое большее что из-за этого может произойти, по моему, так это поменяются в результате найденные местности (с максимальным кол-вом одновременно встречающихся фамилий) местами.
Из-за того, что есть уверенность в однотипном написании только названий областей, предлагаю (для пробы) на них и остановиться. Т.е. выводить в результате работы программы именно их, не углубляясь. Надо бы как-нибудь, вообще, сначала проверить, рабочая это идея или нет. А то вот обсуждаем тут, а она, как окажется, того не стоит
P.S.: в прошлом сообщении описался, конечно - не MySQL, а SQLite