Программы для обработки данных из метрических книг
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 15:22 microArt, как я писал выше, считаю нецелесообразным составление деревьев при набивке данных, так как набивка должна проводиться максимально просто без вынесения решений. И так проще избежать ошибок.
А вот в дальнейшем при наличии нескольких метрик по приходу, можно автоматически делать поиск и строить связи по персонам. | | |
Maksim Andreevich Москва Сообщений: 10132 На сайте с 2016 г. Рейтинг: 5149
| Наверх ##
23 октября 2019 15:25 microArt написал: [q] который бы помог мне составить таблицу связей на основании записей из метрических книг прихода (а может, и приходов).[/q]
Это крайне сложно из-за вариативности написания имен, возрастов и т.п. Даже в своем древе я не сразу понял, что внесенные 2 персоны - это на самом деле одна... | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2495 | Наверх ##
23 октября 2019 15:31 Понимаете, нужен программный инструмент (в настольном варианте) для обработки записей из метрических книг в возможностью расширения (внесения/увязки информации из исповедных росписей, других документов. Основа - это метрическая книга). Люди (персоны), между ними выстраиваются связи (браки, дети). Люди обладают некоторыми характеристиками (даты событий, место событий). Возможность выгрузки данных (тут, несомненно, gedcom, потому что это уже общепринятый стандарт). На общий сервер, на форум, куда угодно. (Экспорт и импорт данных).
Все, как в генеалогической программе, но идет сплошная запись из частей метрических книг (а не выборочная, как при составлении личного генеалогического древа).
А если честно, то пользоваться такой программой мало кто будет. Может, два-три человека - энтузиаста. Потому что обычно многие только выбирают из метрик записи по своему древу.
Не знаю, что и думать. Трудозатраты будут большими, а толку мало. Я вот даже для себя все никак не начну делать что-то подобное. Есть краеведы (не генеалоги, а именно краеведы), которые составляют такие списки, например, по определенной деревне.
Может, это вообще ошибочная идея - выписывать данные из метрических книг "сплошным потоком". --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 15:46 Я вот думаю попробовать сделать сначала каталог метрик по одной церкви, далее сделать форму для внесения данных. Возможно, получится также сделать, как просили в соседней теме, чтобы одновременно видеть картинку и форму для заполнения. Кстати, можно сделать выгрузку заполненных на сайте данных в эксель. | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2495 | Наверх ##
23 октября 2019 15:52 paul1914 написал: [q] Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах.
[/q]
Ага. Тут хотя бы с одним уездом разобраться бы. И для начала хотя бы выяснить все имеющиеся документы в архивах по этому уезду. (Конкретно - Порховский уезд Псковской губернии). Нет, история государства Российского нам не светит. Это будет только волонтерский проект. Чисто на энтузиазме кого-то. Пока не надоест. Все-таки, лучше форума никак не придумаешь. Потому что каждый человек организует хранение данных по-своему, как ему удобно. Используются разные программы, начиная от офисного пакета (MS Office, Libre Office) и заканчивая специализированными, иногда самописные (которые пишет под конкретные задачи). И потом публикует (при желании) свои наработки на форуме. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
G_Spasskaya Москва Сообщений: 7643 На сайте с 2015 г. Рейтинг: 4255 | Наверх ##
23 октября 2019 15:58 microArt написал: [q] Для меня сложность представляет алгоритм обработки информации так, чтобы выстраивались связи отношений. (Связи между различными записями в базе данных).
[/q]
По-моему, это тупиковый путь. То есть не совсем тупиковый, но максимально ресурснозатратный при минимальной эффективности. Во-первых, любая книга содержит ошибки, к сожалению. Иногда их немало. Кто и на каком основании примет решение, что такая-то запись содержит ошибку? А если ошибка будет неправильно истолкована? Я уверена, что только сам исследователь для себя может в какой-то момент решить, что на основании изученного им материала (а это могут быть совсем иные документы, а вовсе не метрики) можно считать, например, что вышенаписанная Агафья на самом деле Глафира. Во-вторых, не надо интерпретаций. Если будет поиск по записям, пользователь должен иметь возможность сделать выборку по любому параметру записи и работать с исходным материалом, а не кем-то составленными связями. Не говоря уже о том, что в некоторых случаях эти связи восстановить невозможно. Я представляю себе эту базу так: (например, для рождений) Поле номер - номер Поле дата рождения - дата Поле дата крещения - дата Поле имя ребенка, два поля - имя из списка и комментарий (если что-то приписано дополнительно) Поля родителей: статус - принадлежность - территориальная привязка - - "служебная" привязка - фио отца - вероисповедание - фио матери - вероисповедание - комментарий. Поля кто крестил - территориальная привязка - должность - фио - комментарий Поля восприемников - аналогично родительским, только для женщин надо добавить еще поле родственной зависимости (часто пишут "жена такого-то или дочь такого-то". Комментарий у каждого обязательно. И вот такую таблицу заполнять по МК, максимально все поля выбирать из предложенных списков. --- Прошлое не "позади нас", оно - в нас. | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 16:02 23 октября 2019 16:18 Первой итерацией я планирую отобрать из оцифрованных метрик записи по одной церкви и сложить их в папки по годам. Далее - вывесить на сайте список этих метрик. Затем займусь созданием форм заполнения. Как я их вижу (отредактировано на основе предложений G_Spasskaya):
Рождение: 1. Сквозной id записи, заполняется автоматически при сохранении записи. 2. Имя, как записано (в старом алфавите) 3. Имя, как используется сейчас. (Иоанн -> Иван и т.п.) 4. Место 6. Дата рождения 7. Дата крещения 8. Комментарий
Родители: статус - принадлежность - территориальная привязка - - "служебная" привязка Отец: 1. Имя 2. Отчество 3. Фамилия 4. Вероисповедание Мать: 1. Имя 2. Отчество 3. Фамилия 4. Вероисповедание
Комментарий.
Воспреемники: 1. Имя 2. Отчество 3. Фамилия статус - принадлежность - территориальная привязка - - "служебная" привязка Коментарий Для женщин - поле о родственнике - муже, отце и т.п.
Вопросы: - Как лучше записывать имена - в старом виде, в новом, в обоих? (с другой стороны автоматизация поиска должна работать с паттернами имён, находя для запроса Иван также записи с Iоаннъ) - В какое поле правильнее записывать отчества крестьян, у которых не записана фамилия? Априори считать, что Иван Иванов это Иван Иванович? - Нужно ли отмечать данные о священниках, проводивших обряд, или это лишняя информация? | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 16:09 G_Spasskaya, да, вот это и имею в виду. Спасибо за напоминание про некоторые поля. | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2495 | Наверх ##
23 октября 2019 16:19 23 октября 2019 16:30 Если без связей, то это просто. Стандартизируются только имена-отчества, да названия деревень, которые выбираются из списка. Все остальное - просто вносится информация из метрических книг. Без анализа и без связей. (Да и то вопрос о степени детализации - насколько подробно это нужно делать? Если все равно потом при составлении связей, древа, будем пользоваться исходными документами, т.е., метрическими книгами). Еще, при записи ребенка отчество для него составляется программой, исходя из имени отца. Больше не вижу, что тут можно автоматизировать. Но тогда это будет только поисковый индекс, а не информационная система. Потенциал компьютера не используется в полной мере. Если только статистика: сколько человек из той или иной деревни, сколько носителей такого-то имени и т.п.
Тут еще вот что, на мой взгляд. Каждый создает такие каталоги для себя, для своих целей, а эти цели разные. Кто-то - выписывает данные только по своему роду, кто-то - по определенному населенному пункту, для кого-то важны данные о восприемниках и свидетелях на свадьбе, а кому-то такая информация не нужна. Уровень детализации тоже по разному (насколько данные подробны).
Тогда это получается так. Некоторый сайт, на котором заранее составлены справочные списки: - губерния/уезд/приход/деревня (с указанием географических координат), - список имен/отчеств, - документов (метрических книг, с указанием архивного шифра и того, занесены они в БД или нет, да/нет), - и дальше - просто набор полей (для трех частей), которые характерны для этой части метрических книг.
Данные можно редактировать на самом сайте (он-лайн, с указанием того, кто редактировал), а можно брать из присланных файлов, составленных по заранее определенной форме (таблица).
Связи не выстраиваются. При желании, можно прикрепить скан страницы метрической книги (или иного документа).
Валидность (корректность) данных решается жалобой другого заинтересованного пользователя, если он обнаружил в чем-то ошибку и прислал жалобу администрации сайта. А так - на свой страх и риск.
Еще при регистрации на таком сайте каждый пользователь выбирает для себя конкретный приход, чьи документы он будет вносить. Он же может редактировать справочник документов этого прихода или справочник населенных пунктов этого прихода.
Но все равно такой сайт не будет популярным в народе. И обязательно экспорт данных с сайта, хотя бы по своему собственному приходу (тот, который редактируешь).
(А для себя я все же попробовала бы сделать информационную систему в настольном варианте). --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 16:50 microArt, [q] Если все равно потом при составлении связей, древа, будем пользоваться исходными документами, т.е., метрическими книгами).[/q]
Зачем исходными документами? Человек ищет какого-то предка, находит - и понеслась - начинает искать такие же отчества, фамилии и т.п., просматривать поисковую выборку по деревне и т.п. Забив данные в таблицу, с ними можно производить фантастические манипуляции. В теории можно (это даже не так сложно), выбрав одного человека, построить для него автоматически список всех родственников, основанный на схожих данных по приходу. [q] названия деревень, которые выбираются из списка[/q]
Это может быть отправной точкой, но нужно оставить возможность для внесения географических названий в свободном формате, так как в моих метриках, например, откуда только люди не встречаются. [q] Валидность (корректность) данных решается жалобой другого заинтересованного пользователя, если он обнаружил в чем-то ошибку и прислал жалобу администрации сайта. А так - на свой страх и риск.[/q]
Да, так и нужно. А то, что на свой страх и риск, то всегда можно проверить по оригиналу. Возможно, я не пояснил, что к каждой записи будет прикрепляться ссылка на оригинал изображения[q] обязательно экспорт данных с сайта, хотя бы по своему собственному приходу[/q]
Это легко реализуемо, в том числе с заданными параметрами (деревня или фамилия) [q] Данные можно редактировать на самом сайте (он-лайн, с указанием того, кто редактировал)[/q]
Версионность хороша, но также не стоит давать всем подряд редактировать уже заведённые метрики. Мне кажется, это можно доверить только модератором и их правки уже версионировать. [q] можно брать из присланных файлов, составленных по заранее определенной форме (таблица).[/q]
Да, такой вариант тоже удобен будет, так как многие, насколько я понял, заполняют всё в эксель, сидя в архиве | | |
|