Программы для обработки данных из метрических книг
Arcobaleno Псков Сообщений: 2803 На сайте с 2010 г. Рейтинг: 4563 | Наверх ##
25 октября 2019 20:03 25 октября 2019 20:17 Rychagov написал: [q] Как думаете, что делать в таких случаях? Тут просится отчество "Спиридонов", а также имя "Наталья".[/q]
А возможен вариант, когда с уверенностью вносится *ридонов" и "Ната*, а " с неуверенностью" -- полные имена? И, соответственно, выделить другим цветом, что такое прочтение под вопросом. Примерно, так: Спиридонов или так: ридонов ( Спиридонов) Хотя в данном конкретном случае лично у меня сомнений нет, но в других подобных ситуациях ответ может быть не настолько очевиден. Вот только непонятно, как при этом будет осуществляться поиск. --- ОСТАФЬЕВЫ, ДЕНИСЕНКО - Кубань
БОРДИКОВЫ (БОРДЮГОВЫ) - Воронежская губ
ФЕДОРОВЫ (БОЛЬШАКОВЫ) - Псковск.у., д.Загорье
ЛАКМАН, ВАЛИУС, ЛИСТЕНИУС, ТОЛИАНДЕР, ВЕНДАЛИУС, БУЛИХ - Финляндия
ГАРКУША - Абинская | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 52 | Наверх ##
25 октября 2019 20:08 Arcobaleno написал: [q] А возможен вариант, когда с уверенностью вносится *ридонов" и "Ната*, а "с неуверенностью" — полные имена? И, соответственно, выделить другим цветом, что такое прочтение под вопросом. Примерно, так: Спиридонов[/q]
Думаю, что на основе сложных примеров выработаются какие-то правила со временем. | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2491 | Наверх ##
25 октября 2019 20:34 Елагин написал: [q] Если моё село всегда было Пелагиада,а в метрике будет написано Пеноглада так и оставить?
[/q]
Не, такое исправлять. В идеале, надо бы все к карте привязать. Но этого я даже по своим селам (Богородицкий приход) сделать не могу. Потому что надо спрашивать у знающих людей (я там вообще мало в географии понимаю), а мне лень. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2491 | Наверх ##
25 октября 2019 20:37 --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 52 | Наверх ##
25 октября 2019 20:37 [q] А в чём тогда смысл создания базы?Просто оцифровать ? Если моё село всегда было Пелагиада,а в метрике будет написано Пеноглада так и оставить?
[/q]
Начинаю задумываться о золотой середине между вашими предложениями и дословным переписыванием метрик. Нужно только придумать, на каком основании можно указанные с опечаткой сведения в базе менять. Либо, как пишет Arcobaleno про финские сайты, сделать две версии - одна наполняется строго в соответствии с метриками и модерируется, а другую ведут пользователи. Но это всё равно не ну-ну от ошибок в причислении чужих Ивановых к своим. Между тем, если сравнивать с Подвигом Народа, то они как раз пишут то, что указано в документе. У меня у предков как-только не коверкаются там названия населённых пунктов: Червянка (Черпянка, Червячки), Заорлица (Заворница, Заорнища), Клюкошицы (Клюкожницы, Клюкошици, Клюкужицы) Это затрудняет поиск документов. Я даже приноровился предугадывать варианты, чтобы находить. Вопрос ко всем - как считаете, если можно однозначно определить по волости или приходу название деревни, то нужно писать её реальное название или то, что указано в метриках? Сложность может возникнуть, если есть два пункта, схожих по названию. Например, Авинище и Авинчище - не всегда можно однозначно трактовать, в названии какого населённого пункта сделана опечатка. | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 52 | Наверх ##
25 октября 2019 20:43 [q] Потому что надо спрашивать у знающих людей (я там вообще мало в географии понимаю), а мне лень[/q]
А в чем заключается основная сложность? Есть списки населённых пунктов Витебской/Псковской губерний. Также есть старые карты тех лет. Открываете гугл- или яндекс-карты, чтобы смотреть, сохранились ли какие ещё и вперёд. Можно даже для себя в Конструкторе карт Яндекса накидать эти пункты. Я вот благодаря карте Псковских приходов и списка населённых пунктов Витебской губернии нашёл приход, который ещё ближе к исследуемой деревне, чем тот, чьи метрики изучаю. Посмотрел на вашем сайте приход и скачал плёнки у мормонов за первый попавшийся год - первая же запись о рождении оказалась по моему двоюродному прадеду. Так что карты это важно. | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 52 | Наверх ##
25 октября 2019 20:52 Елагин написал: [q] Если же в каждой базе будет уточнение ,что имена приводятся на один манер для удобства работы с базой,это найдёт понимание у всех. Ну и упоминание про особый пункт*примечание,который к настоящей метрике отношения не имеет..[/q]
Думаю, что можно сделать так, как некоторые поля на MyHeritage с указанием точности соответствия: Населенный пункт (как в метрике): Заорница Точность названия: указано точно (по умолчанию), указано неразборчиво (для случаев, когда непонятно, что указано), указано с ошибкой/опечаткой Во втором случае появляется поле Предположительно:В третьем случае появляется поле Точное название:Но это ппц сколько логики на приложение придётся наворачивать. Возможно, для начала стоит как-то попроще, а потом усовершенствовать. | | |
Arcobaleno Псков Сообщений: 2803 На сайте с 2010 г. Рейтинг: 4563 | Наверх ##
25 октября 2019 22:36 microArt написал: [q] Не, такое исправлять.[/q] Если начинать что-то исправлять, то очень трудно будет найти ту грань, до которой исправлять не надо, а после которой -- уже надо. Я понимаю, что есть ошибки очевидные, как у моего предка, например, в МК забыли написать имя. Отчество и фамилия есть, а имени нет  К счастью, я это имя знаю. Я думаю, что в случае ошибок, или когда часть текста уходит в переплет, надо писать в одном поле оба варианта: Пеноглада (Пелагиада) _ридонов (Спиридонов) А вопрос с поиском решается так: надо, чтобы система по умолчанию умела искать по части текста из каждого поля. Например, если мы вводим в поиске Спиридонов, система находит и этого персонажа тоже: _ридонов (Спиридонов)Все окна заполняются самими пользователями. Вроде, каждый заинтересован в том, чтобы все сделать правильно. Как с модерированием -- не знаю. Это какой же штат модераторов надо иметь? Практически столько же модераторов, сколько и пользователей, но думаю, что это нереально. Rychagov написал: [q] Вопрос ко всем - как считаете, если можно однозначно определить по волости или приходу название деревни, то нужно писать её реальное название или то, что указано в метриках?[/q]
Думаю, что оба -- одно из метрик и в скобках то, которое считаете правильным. То же самое и с вариантами имен: Иоанн (Иван), Стефан (Степан). Писать только современное имя считаю неверным, все-таки метрика должна быть первична. Елагин написал: [q] Ну и там они предлагают указать об ошибке чтоб как то исправить...[/q]
Предлагают, да. Сообщила об ошибке на Подвиге Народа еще несколько лет назад -- не реагируют. То же самое и с Google-картами, кстати. У них есть явная ошибка, просто грубейшая! Писала им миллион раз -- ни ответа, ни привета. Rychagov написал: [q] сколько логики на приложение придётся наворачивать[/q]
Я не сторонница разных наворотов. Чем проще -- тем лучше. --- ОСТАФЬЕВЫ, ДЕНИСЕНКО - Кубань
БОРДИКОВЫ (БОРДЮГОВЫ) - Воронежская губ
ФЕДОРОВЫ (БОЛЬШАКОВЫ) - Псковск.у., д.Загорье
ЛАКМАН, ВАЛИУС, ЛИСТЕНИУС, ТОЛИАНДЕР, ВЕНДАЛИУС, БУЛИХ - Финляндия
ГАРКУША - Абинская | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 52 | Наверх ##
25 октября 2019 23:02 Arcobaleno написал: [q] А вопрос с поиском решается так: надо, чтобы система по умолчанию умела искать по части текста из каждого поля. Например, если мы вводим в поиске Спиридонов, система находит и этого персонажа тоже: _ридонов (Спиридонов)[/q]
Мне нравится эта идея со скобками. Единственный минус - при поиске по базе будет несколько больше нагрузка. | | |
Arcobaleno Псков Сообщений: 2803 На сайте с 2010 г. Рейтинг: 4563 | Наверх ##
25 октября 2019 23:29 Rychagov написал: [q] Единственный минус - при поиске по базе будет несколько больше нагрузка. [/q]
В отношении вариантов имен возможно еще вот что. У финнов ))) когда набираем в поиске женское имя Carin , вылезают варианты: Carin Karin Katharina Catharina Anna Katharina (и др. двойные имена) Kaarin Catarina и так далее... На самом деле, Карин и Катарина являются вариантами одного имени и поиск каким-то образом это учитывает. Я не знаю, что проще -- писать варианты имени в скобках или научить поиск считать подварианты за одно имя? Но даже если научить этому поиск, для исправления ошибок я бы все равно использовала скобки. Название, как в метрике и в скобках -- правильное. Финский сайт, кстати, не может выдать через поиск более 1500 записей, это к вопросу о нагрузке. Если записей больше, то выдает только 1500, и пишет: More than 1500 events found. Search interrupted! (Найдено более 1500 событий. Поиск прерван!). В этом случае, соответственно, надо выставлять больше ограничений при поиске. --- ОСТАФЬЕВЫ, ДЕНИСЕНКО - Кубань
БОРДИКОВЫ (БОРДЮГОВЫ) - Воронежская губ
ФЕДОРОВЫ (БОЛЬШАКОВЫ) - Псковск.у., д.Загорье
ЛАКМАН, ВАЛИУС, ЛИСТЕНИУС, ТОЛИАНДЕР, ВЕНДАЛИУС, БУЛИХ - Финляндия
ГАРКУША - Абинская | | |
|