Программы для обработки данных из метрических книг
| Maksim Andreevich Москва Сообщений: 9911 На сайте с 2016 г. Рейтинг: 5164
| Наверх ##
23 октября 2019 17:44 Rychagov написал: [q] Как в итоге предлагаете заполнять имена? Iоаннъ Иоанн Иван[/q]
Как в МК. А в мозги программы зашить справочник со всеми возможными вариантами написания и выдачей их в поиске. | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 17:45 А вообще даже если один год будет проиндексирован, то ищущий человек, зайдя на портал и найдя свой населённый пункт, получит уже отправную точку в своём дальнейшем исследовании. Даже если кто-то заведёт из метрики только своих - всё равно выдаст поиск по деревне - человек узнает, что метрики точно есть.
Насчёт кучи полей - надо будет позже их как-то стандартизировать, чтобы было ясно, какие поля лучше просто добавлять в комментарии к записи в метрике, а под какие заводить отдельное поле с выбором вариантов, к примеру. | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3295 На сайте с 2008 г. Рейтинг: 2510 | Наверх ##
23 октября 2019 17:46 Вуколов.
В одном случае под номером 1, в другом - под номером 7. Бракосочетания, Богородицкий приход, Порховский уезд, Псковская губерния. 1883 (под № 7) и 1890 год (под № 1).
 --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
| maxmalk Москва Сообщений: 415 На сайте с 2019 г. Рейтинг: 382
| Наверх ##
23 октября 2019 17:48 23 октября 2019 17:50 Нужно программу научить, чтобы она распознавала одинаковые имена. Т.е. не в каждую конкретную запись вносить пояснение, что Iоаннъ это Иван, а в целом при любом поисковом запросе "Иван", выдавался и Иоанн, и Iоанн, и Иоан и Иван и т.п.
---
Вукол - это календарное имя, именины 19 февраля. --- Миняевы/Меняевы/Миновы/Минины (д. Волково Лотошинский/Старицкий)
Нарышкины (д. Романово Корчевской/Кимрский, г. Кашин)
Мальковы (д. Кузнецы Бежецкий/Максатихинский)
Хорьковы/Харьковы (с. Теряево, Волоколамский/Клинский МО) | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3295 На сайте с 2008 г. Рейтинг: 2510 | Наверх ##
23 октября 2019 17:53 23 октября 2019 17:54 coika написал: [q] адо чтобы оригинал сообщения был на самом сайте, без привязки к другим сайтам. [/q]
Ага. Вы представляете тогда, сколько за хостинг вообще платить надо будет? Потому что эти изображения будут самыми ресурсоемкими (в плане дискового пространства). Сама-то база данных компактна будет. Место занимать будет веб-интерфейс к ней (то, что мы видим на экране, всякие формы, поля, поля со списком, списки и прочие элементы интерфейса), а самые ресурсоемкие будут именно эти графические образы. Особенно если хранить их в хорошем качестве. На основе своего сайта скажу. На бесплатном хостинге. Лимит дискового пространства (не база MySQL) - 1 Гб. Занято примерно 350 мб. Но при этом все большие файлы храню на Яндекс-диске, а на сайте даю ссылку на них. И другим так советую. Если жалоба не поступит (от правообладателя, у меня так только один раз было), то все будет нормально. И то тогда сразу же администрации Яндекса жалобу направили, я сунулась, ан - zip-файл уже недоступен. Было дело. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3295 На сайте с 2008 г. Рейтинг: 2510 | Наверх ##
23 октября 2019 17:58 maxmalk написал: [q] Нужно программу научить, чтобы она распознавала одинаковые имена. Т.е. не в каждую конкретную запись вносить пояснение, что Iоаннъ это Иван, а в целом при любом поисковом запросе "Иван", выдавался и Иоанн, и Iоанн, и Иоан и Иван и т.п.
[/q]
Это и будет справочником имен. Реляционная база данных. Выбрали из списка Иоанн, а рядом в другом поле написали то, как в метрике, со всеми вариантами. Но поиск будет идти по первому полю, где написано "Иоанн". Так же и с отчеством. Фамилии только в таком случае произвольно записываются. Но можно сделать даже справочник фамилий, они постепенно выяснятся, по просмотре метрик. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 18:01 23 октября 2019 18:01 [q] Нужно программу научить, чтобы она распознавала одинаковые имена. Т.е. не в каждую конкретную запись вносить пояснение, что Iоаннъ это Иван, а в целом при любом поисковом запросе "Иван", выдавался и Иоанн, и Iоанн, и Иоан и Иван и т.п.[/q]
Да, про это писал выше, что при поиске нужно учитывать паттерны имён. Ещё вопрос - вносить ли порядковые номера записи (тем более, у мальчиков свои, у девочек - свои)? Или достаточно того, что будет прикреплена картинка с метрикой? Единственное затруднение держать картинки у себя - стоимость места. Потому что в идеале размещать надо большие объёмы в Amazon S3. Но пока можно и на сервере хранить, пока объёмы будут небольшие. А там найти уже спонсоров и выйти на госуровень =))) | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3295 На сайте с 2008 г. Рейтинг: 2510 | Наверх ##
23 октября 2019 18:08 Для образца прикладываю свой файл (таблица Excel) с выписками (браки) из метрических книг Богородицкое (Порховский уезд). За три года. Сначала возраст не указывала, потом стала указывать.
Прикрепленный файл (Индекс метрических книг.xlsx, 29666 байт)--- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (1) |
microArt г.Гатчина, Ленинградская область Сообщений: 3295 На сайте с 2008 г. Рейтинг: 2510 | Наверх ##
23 октября 2019 18:11 Елагин написал: [q] проделать то же самое с рев.сказками.[/q]
У кого они есть. У меня, например, только метрические книги (благодаря мормонам, и других документов не будет). Даже исповедные росписи за деньги из архива для меня получить трудно, потому что банально, столько денег у меня нет. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
| maxmalk Москва Сообщений: 415 На сайте с 2019 г. Рейтинг: 382
| Наверх ##
23 октября 2019 18:16 Елагин написал: [q] Чтоб за неё взяться надо; и легче и многим нужней; проделать то же самое с рев.сказками.[/q]
Кстати да, разумнее начать со списочных источнков (ревизии, исповедки, сельскохозяйственные переписи). Образуется "скелет", а уже на него наращивать "мясо" в виде записей из метричек. Хотя тут потребуется самостоятельная увязка людей из списочных источников с людьми из метричек, а выше уже были возражения против этого... --- Миняевы/Меняевы/Миновы/Минины (д. Волково Лотошинский/Старицкий)
Нарышкины (д. Романово Корчевской/Кимрский, г. Кашин)
Мальковы (д. Кузнецы Бежецкий/Максатихинский)
Хорьковы/Харьковы (с. Теряево, Волоколамский/Клинский МО) | | |
|