Программы для обработки данных из метрических книг
RychagovIn Search We Trust  Санкт-Петербург Сообщений: 114 На сайте с 2019 г. Рейтинг: 53 | Наверх ##
23 октября 2019 10:22 23 октября 2019 10:26 coika, [q] Для начала нужны программы ускоряющие процесс перепечатки[/q]
Опишите подробнее, чего хотелось бы. Если все эксели в одном формате, то перевести их веб-отображение не проблема. [q] Может быть еще какие-то голосовые обработки написанного, а потом преобразование в текст?[/q]
Так вряд ли получится, потому что ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать - потом возись исправляй. Они же таких слов и не знают. Например, "Витебская губерния" они осилят, но вот "Невельский уезд, Серутская волость, Журавковское общество, деревня Заорлица" - вряд ли. Можно было бы подумать о нейросетях, но это очень сложно. arkan1973, Хостинг это самое простое в данном случае. Поначалу рублей 200 в месяц будет хватать. | | |
arkan1973 Кемеровская обл. г. Прокопьевск Сообщений: 100 На сайте с 2015 г. Рейтинг: 64
| Наверх ##
23 октября 2019 11:32 Rychagov написал: [q] Хостинг это самое простое в данном случае. Поначалу рублей 200 в месяц будет хватать.[/q]
Так в том и дело, что поначалу. Хоть и недорого но их тож надо найти... Хотя я За, если что поддержу, правда мой серьезный программистский опыт закончился на FoxPro, но понимание осталось. | | |
paul1914 Сообщений: 332 На сайте с 2013 г. Рейтинг: 152
| Наверх ##
23 октября 2019 11:52 Заношу данные в sqlite в свободное от жизни время. Rychagov написал: [q] Опишите подробнее, чего хотелось бы.[/q]
Сделайте инструмент, а там видно будет. В качестве базы можно использовать sqlite как вариант. Монетизацию надо продумать сразу, например, предоставивший данные получает от запросов к этим данным, а построивший систему получает %. И юридические моменты тоже. При чем тут мормоны, у меня например у мормонов ничего нет, проект независимый ни от каких мормонов, или даже конкурирующий. Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского. Разные имена, значит разные, это уже исследовательская работа. Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах. --- Владимирская губерния, приходы Есиплево, Старково, Кузьминское Ильинской волости, Новобусино, пог. Осовицы, Глумовская Новоселка, Кривдино, Вошня (Юрьевский уезд), пог. Архангельский, пог. Данутино (Покровский уезд), Мошнино, Мячково (Александровский уезд), Сербилово (Суздальский уезд). | | |
ЛюбчиноваОльга, инженер-строитель на пенсии  Омск Сообщений: 17111 На сайте с 2010 г. Рейтинг: 8663 | Наверх ##
23 октября 2019 12:06 23 октября 2019 12:09 Rychagov написал: [q] Так вряд ли получится, потому что ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать - потом возись исправляй.[/q]
Да хотя бы есть же люди с дефектами речи, с акцентами, с местным диалектом в говоре и т.п. - никакая Алиса правильно не разберет... paul1914 написал: [q] Хорошо бы загнать в систему все документы, а на выходе "История государства Российского" в 5-ти томах.[/q]
мечты, мечты... Хорошо если на выходе 50 томов получится, а не 500... Волонтерам такой объем не осилить. --- Любчин(ов), Пострешкин (Пострехин), Свидерский(ой)(ов), Балов, Самсонов, Тугов, Сухов(ых), Табанаков, Пакулев, Суранов, Потоцкий, Чулков, Черданце(о)в, Кунгуров, Buck, Joa, Brinkmann, Kibbermann, Си(е)дя(е)ков, Шляпников, Вьюков, Булгаков, Рождественский, фон Йорк, Костюков | | |
Maksim Andreevich Москва Сообщений: 10132 На сайте с 2016 г. Рейтинг: 5146
| Наверх ##
23 октября 2019 12:18 23 октября 2019 13:04 Любчинова написал: [q] Хорошо если на выходе 50 томов получится, а не 500... Волонтерам такой объем не осилить.[/q]
Мои расчеты "от фонаря". В одном регионе, например, 5 000 МК (данные одного госархива). Понятно, что где-то вообще нет, где-то гораздо больше. Умножаем на 85 субъектов и на средний листаж 300 (аналогично, есть МК в 50 листов, а есть в 1000). Итого около 130 млн листов. 30 мин на индексацию 1 листа. Получается 65 млн часов = 8 млн раб.дней = 33 тыс лет индексации. Т.е. непрерывно полный рабочий день 33 года должны работать 1000 человек.Если делать двойную индексацию для уменьшения ошибок, то умножаем на 2 + время на арбитраж. И это только МК, а нужны еще как минимум РС. | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3408 На сайте с 2017 г. Рейтинг: 1723 | Наверх ##
23 октября 2019 13:02 23 октября 2019 13:09 Я согласна залить например свою базу. Но она в ged формате. В Excel только выкладки по годам старше 1862 и документы по Тамбовскому архиву. Переводить в Excel обратно, я уже не осилю. Конечно удобна была бы база с привязкой к справочника и к источникам. Где найти волонтёров для забивки? Например сайт наработок по Тверской территории давно был запущен. Но он так и висит не реализованных. Люди ленятся даже ссылки на свои облака дать. Или же может не понимают как это сделать? Когда мормоны закрыли свой сайт от россиян, многие регионы стали делать такие сайты, но например Тульский хоть как то заполнен, а вот Тверской нет. Можно проработать например такой аспект, что доступ к базе даётся после индексирования определённого Объема данных или ещё как то, что бы база наполнялась... --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
kbg_dnepr Днипро (бывш. Днепропетровск) Сообщений: 7129 На сайте с 2008 г. Рейтинг: 4323
| Наверх ##
23 октября 2019 13:06 Rychagov написал: [q] ни Siri, ни Алиса, ни Google Assistant не смогут большую часть слов разобрать[/q]
В МК собственно информация - это имена. Основной объем работы - именно они. А Невельский уезд можно сказать медленно и четко, если не хочется вписывать ручками. Поэтому, если есть программа с шаблонами, включающими ВЕСЬ повторяющийся текст (крестьянин-собственник села Ширяевки ХХХ и законная жена его ХХ, оба православные), то это будет колоссальным облегчением-ускорением. --- Катерина
Глушак (Брянск.) Ковалев, Федосенко (Могилевск.)
Оглотков (Горбат. у. НГГ) Алькин Жарков Кульдишов Баландин (Симб. губ.)
Клышкин Власенко Сакунов Кучерявенко (Глухов)
Кириченко Бондаренко Белоус Страшный (Новомоск. Днепроп.) | | |
kbg_dnepr Днипро (бывш. Днепропетровск) Сообщений: 7129 На сайте с 2008 г. Рейтинг: 4323
| Наверх ##
23 октября 2019 13:09 paul1914 написал: [q] Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского.[/q]
Мне кажется целесообразным согласовать список имен, но в скобках хорошо бы давать то, что написано. --- Катерина
Глушак (Брянск.) Ковалев, Федосенко (Могилевск.)
Оглотков (Горбат. у. НГГ) Алькин Жарков Кульдишов Баландин (Симб. губ.)
Клышкин Власенко Сакунов Кучерявенко (Глухов)
Кириченко Бондаренко Белоус Страшный (Новомоск. Днепроп.) | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3408 На сайте с 2017 г. Рейтинг: 1723 | Наверх ##
23 октября 2019 13:11 kbg_dnepr, согласна с Вами. Но как осуществлять поиск в тексте? Надо сводить данные хотя бы в таблицу. --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
coika Москва Сообщений: 4820 На сайте с 2013 г. Рейтинг: 14551 | Наверх ##
23 октября 2019 13:20 paul1914 написал: [q] Для приведения имен к одному виду выбрать словарь и ему следовать, например словарь Петровского.[/q]
Многие люди очень щепетильно относятся к написанию даже слов, а уж про имена и не говорю. Для себя я выбрала вариант, что имя для поиска я дублирую рядом, выделяя его цветом, так же как вношу свои поправки, домыслы и исправления - тоже выделяю цветом. так же как например при потере текста, если есть база, то какие-то данные можно восстановить с большой долей вероятности. Rychagov написал: [q] Опишите подробнее, чего хотелось бы. Если все эксели в одном формате, то перевести их веб-отображение не проблема.[/q]
Но это будут мои предпочтения. А нужно учитывать мнение большинства. Хотя наверное так и города создавались с одного маленького домика для кого-то Я ввожу не в экселе, а в ворде. Когда я начинала все записывать, тогда я и не подозревала что эксель удобней. Я пробовала из ворда в эксель, таблица сохраняется, а вот все мои разноцветности пропадают (я помимо своих пометок цветом, еще и рода раскрашиваю в разные цвета). В экселе веду краткую таблицу: ФИО, годы жизни, браки, дети, места проживания. От программы что хотелось бы? Vorogeya написал: [q] например реквизиты для мк вбивать 1 раз, а не 100. Венчание что бы сразу разносилось на двоих и с гиперссылками на всех участников. [/q]
Выше я уже писала, что тестировала образец в какой-то программе, сначала в окошке я выбирала образец написания, а потом просто выпадали окошки, а туда уже вбивать нужные сведения, например, имена и даты. --- Не выпускайте солнце из души - оно теплом по жизни разойдется. Пустите в сердце капельку любви, а капля в океан пусть разольется!
Выше нас только звезды... | | |
|