Программы для обработки данных из метрических книг
arkan1973 Кемеровская обл. г. Прокопьевск Сообщений: 100 На сайте с 2015 г. Рейтинг: 64
| Наверх ##
23 октября 2019 9:21 Evzenia написал: [q] Скажите, а на сколько широка база Мормонов.[/q]
Вы это серьезно? За два года регистрации на vgd ни разу не наведались к мормонам?? Здесь довольно много расписано о поиске документов у них и ссылка на хранилище скачанных у мормонов документов. | | |
СТОКРАТ Ростовская область Сообщений: 3437 На сайте с 2011 г. Рейтинг: 4405 | Наверх ##
23 октября 2019 9:55 У меня зачатки аналогичной базы есть по трём н.п., где предки жили долго и где много фамилий. По одному н.п.приличное кол-во метрик, по другим пока по десятку, наиболее старые и наиболее интересные вношу, но вижу, что чем ближе к 20 веку, тем задача становится невыполнимее для одного человека. Ещё один н.п., который крупный и по которому огромное количество метрик, но все мои фамилии как назло очень редкие и выписывать всё просто неподъёмно -- буквально десяток записей из нескольких сотен мои. Населённых пунктов у меня тоже полсотни. Но важно отметить, что по самой полной базе, которую составил, уже обнаружил много интересных деталей: двойные фамилии, семьи полных тёзок, человек в нескольких записях фигурирует под своей, а в одной -- под фамилией тестя, хотя запись о браке найти не удалось (спасибо редкому отчеству). Думаю, это далеко не всё, что в такой базе можно найти. В общем, видится, что проект нужный, но всеобъемлющий сделать практически невозможно. Слишком огромный материал, требующий непременного участия человека. Круг интересующихся генеалогией небольшой, а готовых на такой подвиг -- ещё меньше. --- АЖИНОВ,ЗАЖЕРИЛО,СНЕГОВОЙ,ДМУХ,ТОПОЛЬ,СЕМИГЛАС(ОВ),БИБЛЫЙ,СЛЕСЬ,ПИГИДА,МАЛЬНЕВ,СОРОКОЛЕТОВ-ВСЁ
ИМЕННЫЕ СПИСКИ ДОНСКИХ КРЕСТЬЯН
На пыльных тропинках
Далёких планет
Останутся | | |
Kfin | Наверх ##
23 октября 2019 10:12 | | |
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 52 | Наверх ##
23 октября 2019 10:22 23 октября 2019 10:26 coika, [q] Для начала нужны программы ускоряющие процесс перепечатки[/q]
Опишите подробнее, чего хотелось бы. Если все эксели в одном формате, то перевести их веб-отображение не проблема. [q] Может быть еще какие-то голосовые обработки написанного, а потом преобразование в текст?[/q]
Так вряд ли получится, потому что ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать - потом возись исправляй. Они же таких слов и не знают. Например, "Витебская губерния" они осилят, но вот "Невельский уезд, Серутская волость, Журавковское общество, деревня Заорлица" - вряд ли. Можно было бы подумать о нейросетях, но это очень сложно. arkan1973, Хостинг это самое простое в данном случае. Поначалу рублей 200 в месяц будет хватать. | | |
arkan1973 Кемеровская обл. г. Прокопьевск Сообщений: 100 На сайте с 2015 г. Рейтинг: 64
| Наверх ##
23 октября 2019 11:32 Rychagov написал: [q] Хостинг это самое простое в данном случае. Поначалу рублей 200 в месяц будет хватать.[/q]
Так в том и дело, что поначалу. Хоть и недорого но их тож надо найти... Хотя я За, если что поддержу, правда мой серьезный программистский опыт закончился на FoxPro, но понимание осталось. | | |
paul1914 Сообщений: 331 На сайте с 2013 г. Рейтинг: 150
| Наверх ##
23 октября 2019 11:52 Заношу данные в sqlite в свободное от жизни время. Rychagov написал: [q] Опишите подробнее, чего хотелось бы.[/q]
Сделайте инструмент, а там видно будет. В качестве базы можно использовать sqlite как вариант. Монетизацию надо продумать сразу, например, предоставивший данные получает от запросов к этим данным, а построивший систему получает %. И юридические моменты тоже. При чем тут мормоны, у меня например у мормонов ничего нет, проект независимый ни от каких мормонов, или даже конкурирующий. Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского. Разные имена, значит разные, это уже исследовательская работа. Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах. --- Владимирская губерния, приходы Есиплево, Старково, Кузьминское Ильинской волости, Новобусино, пог. Осовицы, Глумовская Новоселка, Кривдино, Вошня (Юрьевский уезд), пог. Архангельский, пог. Данутино (Покровский уезд), Мошнино, Мячково (Александровский уезд), Сербилово (Суздальский уезд). | | |
ЛюбчиноваОльга, инженер-строитель на пенсии  Омск Сообщений: 16946 На сайте с 2010 г. Рейтинг: 8555 | Наверх ##
23 октября 2019 12:06 23 октября 2019 12:09 Rychagov написал: [q] Так вряд ли получится, потому что ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать - потом возись исправляй.[/q]
Да хотя бы есть же люди с дефектами речи, с акцентами, с местным диалектом в говоре и т.п. - никакая Алиса правильно не разберет... paul1914 написал: [q] Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах.[/q]
мечты, мечты... Хорошо если на выходе 50 томов получится, а не 500... Волонтерам такой объем не осилить. --- Любчин(ов), Пострешкин (Пострехин), Свидерский(ой)(ов), Балов, Самсонов, Тугов, Сухов(ых), Табанаков, Пакулев, Суранов, Потоцкий, Чулков, Черданце(о)в, Кунгуров, Buck, Joa, Brinkmann, Kibbermann, Си(е)дя(е)ков, Шляпников, Вьюков, Булгаков, Рождественский, фон Йорк, Костюков | | |
Maksim Andreevich Москва Сообщений: 10132 На сайте с 2016 г. Рейтинг: 5137
| Наверх ##
23 октября 2019 12:18 23 октября 2019 13:04 Любчинова написал: [q] Хорошо если на выходе 50 томов получится, а не 500... Волонтерам такой объем не осилить.[/q]
Мои расчеты "от фонаря". В одном регионе, например, 5 000 МК (данные одного госархива). Понятно, что где-то вообще нет, где-то гораздо больше. Умножаем на 85 субъектов и на средний листаж 300 (аналогично, есть МК в 50 листов, а есть в 1000). Итого около 130 млн листов. 30 мин на индексацию 1 листа. Получается 65 млн часов = 8 млн раб.дней = 33 тыс лет индексации. Т.е. непрерывно полный рабочий день 33 года должны работать 1000 человек.Если делать двойную индексацию для уменьшения ошибок, то умножаем на 2 + время на арбитраж. И это только МК, а нужны еще как минимум РС. | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3362 На сайте с 2017 г. Рейтинг: 1689 | Наверх ##
23 октября 2019 13:02 23 октября 2019 13:09 Я согласна залить например свою базу. Но она в ged формате. В Excel только выкладки по годам старше 1862 и документы по Тамбовскому архиву. Переводить в Excel обратно, я уже не осилю. Конечно удобна была бы база с привязкой к справочника и к источникам. Где найти волонтёров для забивки? Например сайт наработок по Тверской территории давно был запущен. Но он так и висит не реализованных. Люди ленятся даже ссылки на свои облака дать. Или же может не понимают как это сделать? Когда мормоны закрыли свой сайт от россиян, многие регионы стали делать такие сайты, но например Тульский хоть как то заполнен, а вот Тверской нет. Можно проработать например такой аспект, что доступ к базе даётся после индексирования определённого Объема данных или ещё как то, что бы база наполнялась... --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
kbg_dnepr Днипро (бывш. Днепропетровск) Сообщений: 7160 На сайте с 2008 г. Рейтинг: 4315
| Наверх ##
23 октября 2019 13:06 Rychagov написал: [q] ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать[/q]
В МК собственно информация - это имена. Основной объем работы - именно они. А Невельский уезд можно сказать медленно и четко, если не хочется вписывать ручками. Поэтому, если есть программа с шаблонами, включающими ВЕСЬ повторяющийся текст (крестьянин-собственник села Ширяевки ХХХ и законная жена его ХХ, оба православные), то это будет колоссальным облегчением-ускорением. --- Катерина
Глушак (Брянск.) Ковалев, Федосенко (Могилевск.)
Оглотков (Горбат. у. НГГ) Алькин Жарков Кульдишов Баландин (Симб. губ.)
Клышкин Власенко Сакунов Кучерявенко (Глухов)
Кириченко Бондаренко Белоус Страшный (Новомоск. Днепроп.) | | |
|