На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Перед тем, как ставить оценку, ознакомьтесь с главной страницей рейтинга архивов, чтобы понять оцениваемые критерии. Оценка 1 - очень плохо, 10 - очень хорошо;
Я правильно понимаю, что все описи выложены в формате pdf в виде картинок и поиск по ним не работает? Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача. Может быть кто-то делал уже для себя и поделиться?
[/q]
Какую же опись вам нужно распознать? Присылайте - наберу. пока все архивы на карантине))) А конкретно - архив набрал все это давным-давно и внес в свою базу данных. Почему продложают выкладывать неоцифрованные описи - загадка.
[/q]
Спасибо за предложение =) Да я, наверное, сам попробую справиться. Тут был вопрос именно принципиально кто то пытался или нет с распознаванием. Теперь понятно, что у всех такая проблема и тест распознать не так просто.
А конкретно - архив набрал все это давным-давно и внес в свою базу данных. Почему продложают выкладывать неоцифрованные описи - загадка.
[/q]
Вы уверены или только предполагаете? Ведь даже в базе оцифрованных дел для просмотра часть из них просто имеют номера, без заголовка. Что-то я очень сомневаюсь, чтобы при таком положении дела из описей, которые до сих пор рукописные, где-то набраны с названиями...
Давайте сделаем следующим образом. Посколько архивы закрыты и случайно появилось много свободного времени))), я напишу пару запросов, а потом поделюсь с вами ответами. Годится?
— А зачем же.... самой-то трудиться? — спросил Воланд. Лет 10 назад я получил ответ на такой запрос, причем из его текста следовало, что проиндексированы не только заголовки дел, но и их содержание в ф. 459 (в моем случае речь шла об описи 5).
Я правильно понимаю, что все описи выложены в формате pdf в виде картинок и поиск по ним не работает? Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача. Может быть кто-то делал уже для себя и поделиться?
[/q]
Как раз сейчас пробую решить задачу с распознаванием текстов описей. Как будут результаты, напишу здесь, но думаю, что не очень скоро. К сожалению, описи на сайте выложены в низком разрешении (возможно для экономии места). Полагаю, что у архива есть электронные тексты описей, им их могли сделать те же организации, которые занимались оцифровкой описей. Такие описи напечатаны современными шрифтами, а не на печатной машинке. Но их не публикуют, потому что "не положено".
Полагаю, что у архива есть электронные тексты описей, им их могли сделать те же организации, которые занимались оцифровкой описей. Такие описи напечатаны современными шрифтами, а не на печатной машинке. Но их не публикуют, потому что "не положено".