Программы для обработки данных из метрических книг
paul1914 Сообщений: 332 На сайте с 2013 г. Рейтинг: 152
| Наверх ##
23 октября 2019 11:52 Заношу данные в sqlite в свободное от жизни время. Rychagov написал: [q] Опишите подробнее, чего хотелось бы.[/q]
Сделайте инструмент, а там видно будет. В качестве базы можно использовать sqlite как вариант. Монетизацию надо продумать сразу, например, предоставивший данные получает от запросов к этим данным, а построивший систему получает %. И юридические моменты тоже. При чем тут мормоны, у меня например у мормонов ничего нет, проект независимый ни от каких мормонов, или даже конкурирующий. Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского. Разные имена, значит разные, это уже исследовательская работа. Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах. --- Владимирская губерния, приходы Есиплево, Старково, Кузьминское Ильинской волости, Новобусино, пог. Осовицы, Глумовская Новоселка, Кривдино, Вошня (Юрьевский уезд), пог. Архангельский, пог. Данутино (Покровский уезд), Мошнино, Мячково (Александровский уезд), Сербилово (Суздальский уезд). | | |
ЛюбчиноваОльга, инженер-строитель на пенсии  Омск Сообщений: 17115 На сайте с 2010 г. Рейтинг: 8664 | Наверх ##
23 октября 2019 12:06 23 октября 2019 12:09 Rychagov написал: [q] Так вряд ли получится, потому что ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать - потом возись исправляй.[/q]
Да хотя бы есть же люди с дефектами речи, с акцентами, с местным диалектом в говоре и т.п. - никакая Алиса правильно не разберет... paul1914 написал: [q] Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах.[/q]
мечты, мечты... Хорошо если на выходе 50 томов получится, а не 500... Волонтерам такой объем не осилить. --- Любчин(ов), Пострешкин (Пострехин), Свидерский(ой)(ов), Балов, Самсонов, Тугов, Сухов(ых), Табанаков, Пакулев, Суранов, Потоцкий, Чулков, Черданце(о)в, Кунгуров, Buck, Joa, Brinkmann, Kibbermann, Си(е)дя(е)ков, Шляпников, Вьюков, Булгаков, Рождественский, фон Йорк, Костюков | | |
Maksim Andreevich Москва Сообщений: 10132 На сайте с 2016 г. Рейтинг: 5146
| Наверх ##
23 октября 2019 12:18 23 октября 2019 13:04 Любчинова написал: [q] Хорошо если на выходе 50 томов получится, а не 500... Волонтерам такой объем не осилить.[/q]
Мои расчеты "от фонаря". В одном регионе, например, 5 000 МК (данные одного госархива). Понятно, что где-то вообще нет, где-то гораздо больше. Умножаем на 85 субъектов и на средний листаж 300 (аналогично, есть МК в 50 листов, а есть в 1000). Итого около 130 млн листов. 30 мин на индексацию 1 листа. Получается 65 млн часов = 8 млн раб.дней = 33 тыс лет индексации. Т.е. непрерывно полный рабочий день 33 года должны работать 1000 человек.Если делать двойную индексацию для уменьшения ошибок, то умножаем на 2 + время на арбитраж. И это только МК, а нужны еще как минимум РС. | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3408 На сайте с 2017 г. Рейтинг: 1723 | Наверх ##
23 октября 2019 13:02 23 октября 2019 13:09 Я согласна залить например свою базу. Но она в ged формате. В Excel только выкладки по годам старше 1862 и документы по Тамбовскому архиву. Переводить в Excel обратно, я уже не осилю. Конечно удобна была бы база с привязкой к справочника и к источникам. Где найти волонтёров для забивки? Например сайт наработок по Тверской территории давно был запущен. Но он так и висит не реализованных. Люди ленятся даже ссылки на свои облака дать. Или же может не понимают как это сделать? Когда мормоны закрыли свой сайт от россиян, многие регионы стали делать такие сайты, но например Тульский хоть как то заполнен, а вот Тверской нет. Можно проработать например такой аспект, что доступ к базе даётся после индексирования определённого Объема данных или ещё как то, что бы база наполнялась... --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
kbg_dnepr Днипро (бывш. Днепропетровск) Сообщений: 7129 На сайте с 2008 г. Рейтинг: 4323
| Наверх ##
23 октября 2019 13:06 Rychagov написал: [q] ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать[/q]
В МК собственно информация - это имена. Основной объем работы - именно они. А Невельский уезд можно сказать медленно и четко, если не хочется вписывать ручками. Поэтому, если есть программа с шаблонами, включающими ВЕСЬ повторяющийся текст (крестьянин-собственник села Ширяевки ХХХ и законная жена его ХХ, оба православные), то это будет колоссальным облегчением-ускорением. --- Катерина
Глушак (Брянск.) Ковалев, Федосенко (Могилевск.)
Оглотков (Горбат. у. НГГ) Алькин Жарков Кульдишов Баландин (Симб. губ.)
Клышкин Власенко Сакунов Кучерявенко (Глухов)
Кириченко Бондаренко Белоус Страшный (Новомоск. Днепроп.) | | |
kbg_dnepr Днипро (бывш. Днепропетровск) Сообщений: 7129 На сайте с 2008 г. Рейтинг: 4323
| Наверх ##
23 октября 2019 13:09 paul1914 написал: [q] Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского.[/q]
Мне кажется целесообразным согласовать список имен, но в скобках хорошо бы давать то, что написано. --- Катерина
Глушак (Брянск.) Ковалев, Федосенко (Могилевск.)
Оглотков (Горбат. у. НГГ) Алькин Жарков Кульдишов Баландин (Симб. губ.)
Клышкин Власенко Сакунов Кучерявенко (Глухов)
Кириченко Бондаренко Белоус Страшный (Новомоск. Днепроп.) | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3408 На сайте с 2017 г. Рейтинг: 1723 | Наверх ##
23 октября 2019 13:11 kbg_dnepr, согласна с Вами. Но как осуществлять поиск в тексте? Надо сводить данные хотя бы в таблицу. --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
coika Москва Сообщений: 4820 На сайте с 2013 г. Рейтинг: 14556 | Наверх ##
23 октября 2019 13:20 paul1914 написал: [q] Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского.[/q]
Многие люди очень щепетильно относятся к написанию даже слов, а уж про имена и не говорю. Для себя я выбрала вариант, что имя для поиска я дублирую рядом, выделяя его цветом, так же как вношу свои поправки, домыслы и исправления - тоже выделяю цветом. так же как например при потере текста, если есть база, то какие-то данные можно восстановить с большой долей вероятности. Rychagov написал: [q] Опишите подробнее, чего хотелось бы. Если все эксели в одном формате, то перевести их веб-отображение не проблема.[/q]
Но это будут мои предпочтения. А нужно учитывать мнение большинства. Хотя наверное так и города создавались с одного маленького домика для кого-то Я ввожу не в экселе, а в ворде. Когда я начинала все записывать, тогда я и не подозревала что эксель удобней. Я пробовала из ворда в эксель, таблица сохраняется, а вот все мои разноцветности пропадают (я помимо своих пометок цветом, еще и рода раскрашиваю в разные цвета). В экселе веду краткую таблицу: ФИО, годы жизни, браки, дети, места проживания. От программы что хотелось бы? Vorogeya написал: [q] например реквизиты для мк вбивать 1 раз, а не 100. Венчание что бы сразу разносилось на двоих и с гиперссылками на всех участников. [/q]
Выше я уже писала, что тестировала образец в какой-то программе, сначала в окошке я выбирала образец написания, а потом просто выпадали окошки, а туда уже вбивать нужные сведения, например, имена и даты. --- Не выпускайте солнце из души - оно теплом по жизни разойдется. Пустите в сердце капельку любви, а капля в океан пусть разольется!
Выше нас только звезды... | | |
coika Москва Сообщений: 4820 На сайте с 2013 г. Рейтинг: 14556 | Наверх ##
23 октября 2019 13:32 23 октября 2019 13:51 Maksim Andreevich написал: [q] Т.е. непрерывно полный рабочий день 33 года должны работать 1000 человек.[/q]
Но здесь конечно, глаза боятся, а руки делают  Я думаю, важнее в бой ввязаться. Пусть будет не все регионы, а хотя бы часть, и это уже много. С неба такая база не свалиться. Вот взять для примера проект Gentry с кладбищами. Честно говоря регистрируясь на его сайте, я и не думала, что когда-то для него наступит окончание, казалось это будет вечно длиться, а ведь подписали волонтеры все его снимки!!!  Правда он сейчас видимо не знает , что теперь с ней делать, но это уже другой вопрос, с МК объем намного больше Так и здесь доступ к базе осуществлять только тех, кто внесет посильный вклад. Оставлять ее открытой нельзя, халявщиков много будет. Занес определенное количество листов - получил доступ к полной базе, только при таком условии она будет пополнятся... Rychagov, нечто подобное пытался осуществить Сизиф на своем сайте здесь --- Не выпускайте солнце из души - оно теплом по жизни разойдется. Пустите в сердце капельку любви, а капля в океан пусть разольется!
Выше нас только звезды... | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3408 На сайте с 2017 г. Рейтинг: 1723 | Наверх ##
23 октября 2019 13:42 coika написал: [q] проект Gentry с кладбищами[/q]
А что это за проект? Поделитесь пожалуйста.. --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
|