Епархиальные ведомости и прибавления
Источники информации
elena_krd Сообщений: 6598 На сайте с 2008 г. Рейтинг: 11367 | Наверх ##
27 сентября 2011 21:58 lactarius написал: [q] Поделюсь своим опытом по поиску фамилий в тексте: так как качество плохое, искать нужно минимальную имеющую смысл подстрочку. Например по фамилии Флоринский я искал подстроку "флор". В результате получал несколько десятков мест в каждой книге, которые уже подробно смотрел.[/q]
Благодарю Вас! Спасибо, что поделились! --- Спасибо.
С уважением, Елена.
----
Шафрановские (Гомельский уезд Могилевской губ.), Целицо(а) (везде), Цы(и)товичи (Могилевская губ.), Ка(о)ктыш (Зубелевичи/Ляховичи, Слуцкого уезда Минской губ.). | | |
dyado-mykola Сообщений: 1117 На сайте с 2011 г. Рейтинг: 1223 | Наверх ##
27 сентября 2011 22:42 А я от жажды у ручья умираю. Не получается у меня в гот файле премиум-аккаунт оплатить, а без него 30метров скачало - секундный разрыв связи - и всё прахом. Вот если бы с депозита, там всё просто - сбросил по эсэмэске деньги и не страшны ни какие перерывы. | | |
lactarius Москва->США->? Сообщений: 394 На сайте с 2011 г. Рейтинг: 372
| Наверх ##
28 сентября 2011 6:22 djada-mykola написал: [q] А я от жажды у ручья умираю. Не получается у меня в гот файле премиум-аккаунт оплатить, а без него 30метров скачало - секундный разрыв связи - и всё прахом. Вот если бы с депозита, там всё просто - сбросил по эсэмэске деньги и не страшны ни какие перерывы. [/q]
Без проблем. Положил на depositfiles: http://depositfiles.com/files/mfrgm9nsv | | |
dyado-mykola Сообщений: 1117 На сайте с 2011 г. Рейтинг: 1223 | Наверх ##
28 сентября 2011 6:28 Спасибо огромное ! | | |
TatianaLGNNМодератор раздела ВГД дарит удочку. Рыбу ловить должны вы сами  Нижний Новгород Сообщений: 25311 На сайте с 2003 г. Рейтинг: 7647 | Наверх ##
28 сентября 2011 8:13 28 сентября 2011 8:14 lactarius Спасибо большое Уже в трех журналах нашла о нижегородцах --- Уважаемые друзья, вновь пришедшие на форум. Очень прошу, прежде чем задать мне вопрос в личку, ну почитайте немного форум.И потом мои знания распространяются не на всю бывшую Российскую империю, а в основном на Нижегородскую губернию.
_______
https://forum.vgd.ru/899/
| | |
ЛюбчиноваОльга, инженер-строитель на пенсии  Омск Сообщений: 17100 На сайте с 2010 г. Рейтинг: 8652 | Наверх ##
28 сентября 2011 14:34 Скачалось нормально, только часа два, не менее качалось... распозналось действительно фрагментами... --- Любчин(ов), Пострешкин (Пострехин), Свидерский(ой)(ов), Балов, Самсонов, Тугов, Сухов(ых), Табанаков, Пакулев, Суранов, Потоцкий, Чулков, Черданце(о)в, Кунгуров, Buck, Joa, Brinkmann, Kibbermann, Си(е)дя(е)ков, Шляпников, Вьюков, Булгаков, Рождественский, фон Йорк, Костюков | | |
Siegehardus | Наверх ##
28 сентября 2011 16:13 Konstantin Ivanov[q] Управился за два часа с четвертью. [/q]
У меня скачалось за 11 мин. | | |
vnbob Сообщений: 542 На сайте с 2013 г. Рейтинг: 116
| Наверх ##
28 сентября 2011 20:25 28 сентября 2011 20:26 lactarius написал: [q] Распознается очень медленно: где-то 1 страница в минуту. Хотя у меня довольно слабая машина. Получается в среднем по одной книге в день. Никакой вычитки я не делал - что распозналось, то распозналось.
Поделюсь своим опытом по поиску фамилий в тексте: так как качество плохое, искать нужно минимальную имеющую смысл подстрочку. Например по фамилии Флоринский я искал подстроку "флор". В результате получал несколько десятков мест в каждой книге, которые уже подробно смотрел.[/q]
Моё Вам уважение за такой труд! Машинка действительно слабая. На 2-х ядерном компе страница распознаётся ~ 6-8 сек.. Поиск нужно делать по всем возможным вариантам, учитывая ошибки распознавания - часто буквы c одинаковым написанием путаются (л-п, и-н и т.п.) Мой совет : поскольку нас в данном случае интересует только текст, в программе распознавания в установках : сохранение результатов нужно убрать сохранение картинок, оформления, шрифтов и вариантов написания - только планарный текст. Т.о. размер выходного файла уменьшится на 2 порядка, и поиск вести быстрее. Ведь в случае нахождения всё-равно придётся обращаться к первоисточнику в PDF | | |
lactarius Москва->США->? Сообщений: 394 На сайте с 2011 г. Рейтинг: 372
| Наверх ##
29 сентября 2011 10:39 vnbob написал: [q] Машинка действительно слабая. На 2-х ядерном компе страница распознаётся ~ 6-8 сек..[/q]
тут странная штука получается. На первых томах распознавание шло раза в 3 быстрее, чем сейчас. Возможно PDF-transformer постепенно накапливает какую-то статистику для улучшения результатов распознавания, но использование этой статистики сильно замедляет процесс vnbob написал: [q] Мой совет : поскольку нас в данном случае интересует только текст, в программе распознавания в установках : сохранение результатов нужно убрать сохранение картинок, оформления, шрифтов и вариантов написания - только планарный текст. Т.о. размер выходного файла уменьшится на 2 порядка, и поиск вести быстрее. Ведь в случае нахождения всё-равно придётся обращаться к первоисточнику в PDF[/q]
Мне кажется картинки и оформление могут быть полезны как раз для того, чтобы потом легче было найти нужное место в оригинальном PDF. С другой стороны, если хочется оставить только голый текст, то сбросить его из Ворда не составляет труда. --- Все мои личные данные, размещены мною на сайте добровольно и специально для поиска родственников
Грибок: село Александро-дар (Рахмановка) Криво-Рогской волости Херсонского уезда Херсонской губернии;
Щежины: Ардатовский уезд Нижегородской губернии | | |
vnbob Сообщений: 542 На сайте с 2013 г. Рейтинг: 116
| Наверх ##
1 октября 2011 15:22 lactarius написал: [q] Мне кажется картинки и оформление могут быть полезны как раз для того, чтобы потом легче было найти нужное место в оригинальном PDF. С другой стороны, если хочется оставить только голый текст, то сбросить его из Ворда не составляет труда.[/q]
1. картинки не нужны! когда производится текстовый поиск - сохраняйте с "разбивкой на страницы", и легко сориентируетесь 2. лучше сделать это сразу, многие так и не смогли скачать Ваш архив по причине большого объёма, где 95% занимают именно изображения, которые -> см. п.1 | | |
|