Программы для обработки данных из метрических книг
Temych Санкт-Петербург Сообщений: 1138 На сайте с 2010 г. Рейтинг: 652 | Наверх ##
8 июня 2022 8:05 8 июня 2022 12:55 parija написал: [q] Продолжая тему автоматического распознавания, пытаюсь найти массив данных чтоб модель нейросети натренировать. Есть в свободном допуске например https://www.kaggle.com/dataset...g-dataset, но это 20 век почерк, надо метрики. Транскирбуса модели тоже тренировали наверное на более легко читаемом почерке. Мне даже не массив данных а просто несколько страничек насобирать, я потом сам разрежу и подготовлю. Где найти вот.[/q]
Посмотрите здесь https://cloud.mail.ru/public/4HPb/yn7dZfQjr. Здесь метрики Сине-Никольской церкви, Опочецкого уезда, Псковской губернии за 1,5 века. Есть все варианты почерков. | | |
VorogeyaПенсионерка  РФ, Москва Сообщений: 3401 На сайте с 2017 г. Рейтинг: 1717 | Наверх ##
8 июня 2022 10:04 8 июня 2022 10:09 --- C уважением, Ирина Владимировна.
---------------------------------------
Осадчий ( Грушевка Апостоловский р-н), Аверин (д. Колмаковка Тамбовская губ.), Синицын (Устье Калязинский у.), Жуков (д. Ефимово Калязинский у.), Трофимов (Б. Огарёво Тульская губ.) | | |
parijaНовичок  Канада Сообщений: 4 На сайте с 2022 г. Рейтинг: 7 | Наверх ##
8 июня 2022 16:11 Vorogeya написал: [q]
Гляньте у меня в дневнике. Выложены ревизии и метрики по нескольким губерниям. Вот например https://forum.vgd.ru/post/2844...#pp2574113 Тверская, Калязинский (ранее Московская, Дмитровский) Богородицкий уезд, до этого Крапивенский Борисоглебский уезд Тамбовской
Более старые тексты здесь:
ЦГА Москвы на сайте Троица - Сергиевой лавры
[/q]
Спасибо! Но я плохо объяснил, мне нужен оригинал (я могу найти много) и перевод. Потом я оригинал разрезаю на слова и составляю таблицу, скан оригинального слова -> перевод Вот это таблица будет входными данными в нейросеть. такое например: | поле | критичны.
  | | |
Руслан ДикушинМодератор раздела  Россия Сообщений: 2020 На сайте с 2011 г. Рейтинг: 18572 | Наверх ##
9 июня 2022 17:17 | | Лайк (1) |
parijaНовичок  Канада Сообщений: 4 На сайте с 2022 г. Рейтинг: 7 | Наверх ##
10 июня 2022 5:37 | | Лайк (1) |
vasya069 Новичок
Сообщений: 8 На сайте с 2022 г. Рейтинг: 6 | Наверх ##
3 августа 2022 14:39 Здравствуйте помогите пожалуйста разобрать этот текс. vasy7837@gmail.com
 | | |
abv Красногорск, Моск.обл. Сообщений: 2143 На сайте с 2004 г. Рейтинг: 914 | Наверх ##
7 декабря 2022 16:44 --- Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
https://1russia.wordpress.com/
| | |
abv Красногорск, Моск.обл. Сообщений: 2143 На сайте с 2004 г. Рейтинг: 914 | Наверх ##
7 декабря 2022 16:54 vasya069 написал: [q] Здравствуйте помогите пожалуйста разобрать этот текс. vasy7837@gmail.com[/q]
Довольно читаемо "Острицкой церкви Острицкой волости Священник Николай Смирнов с диаконом Михаилом Заболовским(?) и псаломщиком Василием Боголепским По жениху крестьяне деревень Грязной Алексей Николаев и Феодот К..ев, по невесте Клевцов Николай Прохоров и села Острица Сергей Васильев Чугунов" Здесь "Клевцов" - по всей видимости, название деревни а родительном падеже. --- Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
https://1russia.wordpress.com/
| | |
abv Красногорск, Моск.обл. Сообщений: 2143 На сайте с 2004 г. Рейтинг: 914 | Наверх ##
7 декабря 2022 16:58 7 декабря 2022 17:01 parija написал: [q] Продолжая тему автоматического распознавания, пытаюсь найти массив данных чтоб модель нейросети натренировать. Есть в свободном допуске например https://www.kaggle.com/dataset...ng-dataset , но это 20 век почерк, надо метрики. Транскирбуса модели тоже тренировали наверное на более легко читаемом почерке. Мне даже не массив данных а просто несколько страничек насобирать, я потом сам разрежу и подготовлю. Где найти вот.[/q]
Могу снабдить вас такими сканами и их переведенными в текст вариантами. Таких текстов на моем сайте http://personalhistory.ru за 17 лет набралось, как вы можете проверить, немало. Из общения с другими знаю, что таким способом, о котором вы пишете, когда составляется табличка изображений букв и их траснкрипция, некоторые и учились легко читать, напр. скоропись 17-19 века. Так что можно организовать для вас сканы+текст и для источников 17-19 веков. --- Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
https://1russia.wordpress.com/
| | Лайк (1) |
xeniale Новичок
Сообщений: 1 На сайте с 2022 г. Рейтинг: 1 | Наверх ##
1 января 2023 14:31 Здравствуйте. Ищем желающих поучаствовать на возмездной основе в проекте по распознаванию/оцифровке рукописей с дореволюционной кириллицей - из метрических книг и исповедок. Задача предполагает: понять/разобрать рукописный текст из набора картинок в файле и напечатать соответствующий текст напротив каждой картинки (подготовка обучающего набора данных для обучения machine learning модели). Заинтересовавшимся просьба обращаться в личку. | | |
|