Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

Общие вопросы

ЦИАМ на Профсоюзной улице

← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 307 308 309 310 311 * 312 313 314 315 ... 524 525 526 527 528 529 Вперед →
Модераторы: Lara, Asmodeika
G_Spasskaya

G_Spasskaya

Москва
Сообщений: 7580
На сайте с 2015 г.
Рейтинг: 4209

sjey написал:
[q]
Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача.
[/q]

Ради интереса, посмотрите, как "прекрасно" распознается текст в пдф, например, на сайте нпиб на примере книг Чернопятова. Да лучше сами книги в оригинале читать, чем эту абракадабру.

А ещё, просто для информации, некоторые описи напечатаны на машинке, а не на компьютере, буквы в них немного скачут по строке, их распознавание будет весьма сомнительным. И я не говорю уж о рукописных описях, коих тоже хватает.
---
Прошлое не "позади нас", оно - в нас.
Helen V

Москва
Сообщений: 6042
На сайте с 2016 г.
Рейтинг: 2493

sjey написал:
[q]
Я правильно понимаю, что все описи выложены в формате pdf в виде картинок и поиск по ним не работает?
Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача. Может быть кто-то делал уже для себя и поделиться?
[/q]

Какую же опись вам нужно распознать? Присылайте - наберу. пока все архивы на карантине)))
А конкретно - архив набрал все это давным-давно и внес в свою базу данных. Почему продложают выкладывать неоцифрованные описи - загадка.
sjey
Новичок

Сообщений: 25
На сайте с 2017 г.
Рейтинг: 1

G_Spasskaya написал:
[q]

sjey написал:
[q]

Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача.
[/q]


Ради интереса, посмотрите, как "прекрасно" распознается текст в пдф, например, на сайте нпиб на примере книг Чернопятова. Да лучше сами книги в оригинале читать, чем эту абракадабру.

А ещё, просто для информации, некоторые описи напечатаны на машинке, а не на компьютере, буквы в них немного скачут по строке, их распознавание будет весьма сомнительным. И я не говорю уж о рукописных описях, коих тоже хватает.
[/q]


Да, вы правы, качество распознавания не очень. Пытаюсь ради интереса разными средствами попробывать. Может быть, удастся что то толковое получить.
sjey
Новичок

Сообщений: 25
На сайте с 2017 г.
Рейтинг: 1

Helen V написал:
[q]

sjey написал:
[q]

Я правильно понимаю, что все описи выложены в формате pdf в виде картинок и поиск по ним не работает?
Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача. Может быть кто-то делал уже для себя и поделиться?
[/q]


Какую же опись вам нужно распознать? Присылайте - наберу. пока все архивы на карантине)))
А конкретно - архив набрал все это давным-давно и внес в свою базу данных. Почему продложают выкладывать неоцифрованные описи - загадка.
[/q]


Спасибо за предложение =)
Да я, наверное, сам попробую справиться. Тут был вопрос именно принципиально кто то пытался или нет с распознаванием.
Теперь понятно, что у всех такая проблема и тест распознать не так просто.
G_Spasskaya

G_Spasskaya

Москва
Сообщений: 7580
На сайте с 2015 г.
Рейтинг: 4209

Helen V написал:
[q]
А конкретно - архив набрал все это давным-давно и внес в свою базу данных. Почему продложают выкладывать неоцифрованные описи - загадка.
[/q]

Вы уверены или только предполагаете?
Ведь даже в базе оцифрованных дел для просмотра часть из них просто имеют номера, без заголовка. Что-то я очень сомневаюсь, чтобы при таком положении дела из описей, которые до сих пор рукописные, где-то набраны с названиями...
---
Прошлое не "позади нас", оно - в нас.
Helen V

Москва
Сообщений: 6042
На сайте с 2016 г.
Рейтинг: 2493

G_Spasskaya написал:
[q]
Что-то я очень сомневаюсь, чтобы при таком положении дела из описей, которые до сих пор рукописные, где-то набраны с названиями...
[/q]

Московский учебный округ - можно искать по фамилиям.
G_Spasskaya

G_Spasskaya

Москва
Сообщений: 7580
На сайте с 2015 г.
Рейтинг: 4209

Helen V написал:
[q]
Московский учебный округ - можно искать по фамилиям.
[/q]

Причём тут Московский учебный округ? Это только один фонд. И не только по нему работает алфавитный поиск.

Но фондов, как вы понимаете, гораздо больше. И не все дела в заголовках имеют фамилии.

Поэтому хотелось бы понять все-таки, вот это утверждение в контексте обсуждения заголовков дел
Helen V написал:
[q]
архив набрал все это давным-давно и внес в свою базу данных.
[/q]
на чем основано?
---
Прошлое не "позади нас", оно - в нас.
Helen V

Москва
Сообщений: 6042
На сайте с 2016 г.
Рейтинг: 2493
Давайте сделаем следующим образом. Посколько архивы закрыты и случайно появилось много свободного времени))), я напишу пару запросов, а потом поделюсь с вами ответами. Годится?
AntonV

Москва
Сообщений: 2835
На сайте с 2003 г.
Рейтинг: 822

Helen V написал:
[q]
[/q]

— А зачем же.... самой-то трудиться? — спросил Воланд.
Лет 10 назад я получил ответ на такой запрос, причем из его текста следовало, что проиндексированы не только заголовки дел, но и их содержание в ф. 459 (в моем случае речь шла об описи 5).
ykrd
Начинающий

Сообщений: 39
На сайте с 2018 г.
Рейтинг: 22

sjey написал:
[q]

Я правильно понимаю, что все описи выложены в формате pdf в виде картинок и поиск по ним не работает?
Вроде бы распознать текст в pdf и сделать человеческий поиск не такая сложная задача. Может быть кто-то делал уже для себя и поделиться?
[/q]

Как раз сейчас пробую решить задачу с распознаванием текстов описей. Как будут результаты, напишу здесь, но думаю, что не очень скоро. К сожалению, описи на сайте выложены в низком разрешении (возможно для экономии места).
Полагаю, что у архива есть электронные тексты описей, им их могли сделать те же организации, которые занимались оцифровкой описей. Такие описи напечатаны современными шрифтами, а не на печатной машинке. Но их не публикуют, потому что "не положено".
← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 307 308 309 310 311 * 312 313 314 315 ... 524 525 526 527 528 529 Вперед →
Модераторы: Lara, Asmodeika
Вверх ⇈