Эффективный поиск по archive.org
В прошлой статье я рассказывала о приёме, который помогает обходить ошибки распознавания текста в яндекс-архивах.
А теперь хочу поделиться находкой, которая буквально перевернула мои представления о доступных онлайн-источниках.
Обычно archive.org воспринимается как большая электронная библиотека редких изданий интересная, но не слишком полезная для частных родословных поисков. Так я думала, пока не обнаружила там длинный фрагмент, посвящённый имению моих предков, с подробностями одного из дел, о которых я даже не подозревала.
Оказалось, что на archive.org скрыто множество русскоязычных материалов, которых нет в других открытых источниках - сенатские объявления, губернские и уездные ведомости, редкие газеты и журналы. Поиск по фамилиям помещиков, названиям населённых пунктов и редким ключевым словам нередко даёт поразительные результаты.
Да, распознавание кириллического текста там далеко не идеально, а поиск кажется запутанным, но поверьте - потраченное время стоит того.
Если вы ищете следы своих предков в старой прессе и официальных объявлениях, не пропустите этот ресурс. Ниже я покажу, как именно искать, чтобы находить максимум возможного.
В своих примерах я буду использовать фамилию помещиков - фон Штральборн, иногда Дерионзини, и населённый пункт - деревня (или сельцо) Ершники.
Чтобы отсеять иностранные издания и сразу работать с российскими материалами, начните поиск с коллекции Russian Empire Genealogy Resources -
⚜️
https://archive.org/details/russianempiregenealogyresourcesОчень важно выбрать опцию “Search text contents” — именно она позволяет искать по распознанному тексту.
Кстати, поиск внутри коллекций даёт гораздо больше результатов, чем общий поиск с главной страницы. Там также лучше работают расширенные приёмы - например, использование звёздочек и комбинаций ключевых слов.
Эффективный поиск по archive.org, изображение №1
Способы поиска
Далее способы поиска можно условно разделить на два основных.
Первый — поиск по полному слову и его вариантам.
В отличие от Яндекса, где система “догадывается” о формах слова по корню, на archive.org этого нет. Поэтому важно вводить слово именно в том виде, как оно могло быть напечатано в оригинале — включая твёрдые знаки и дореформенные написания.
Например, фамилия фон Штральборн:
я ввожу в строку поиска — Штральборнъ (в данном случае лучше без приставки фон).
⚜️https://archive.org/details/russianempiregenealogyresources?tab=collection&query=%D0%A8%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%B1%D0%BE%D1%80%D0%BD%D1%8A&sin=TXT — даёт сразу заметно больше результатов, чем поиск без “Ъ”.
Но и вариант без твёрдого знака тоже стоит проверить:
⚜️https://archive.org/details/russianempiregenealogyresources?tab=collection&query=%D0%A8%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%B1%D0%BE%D1%80%D0%BD&sin=TXT — результаты частично отличаются.
По превью и словам, расположенным рядом с фамилией, обычно легко определить, какой из найденных фрагментов “наш”.
Чтобы не открывать каждую ссылку отдельно, просто наведите курсор на описание — появится больше текста с контекстом ключевого слова.
Эффективный поиск по archive.org, изображение №2
Поиск с учётом ошибок распознавания текста
Ошибки распознавания на archive.org нередки, но часто они подчиняются закономерностям. Если их учитывать, можно получить гораздо больше результатов. Вот некоторые из наиболее частых случаев, которые мне удалось заметить и успешно использовать:
Ъ в конце слова часто распознаётся как мягкий знак “ь”, а иногда — как “з” или “г”.
Примеры:
⚜️ Штральборнь
⚜️ Штральборнз
⚜️ Штральборнг
Буква “н” в конце слова может читаться как “и”:
⚜️ Штральбориъ
В дореформенных текстах сочетание “іо” иногда распознаётся как “ю” или просто “о”.
Поэтому при поиске фамилии Дерионзини полезно проверить и варианты:
⚜️ Дерюнзини
⚜️ Деронзини
Кроме того, результаты расширяются, если учитывать падежные формы:
Штральборна, Штральборну, Штральборномъ (и не забываем твёрдый знак).
Поиск населённых пунктов
С названиями деревень ситуация похожая. Например, для Ершников я использовала разные варианты написания, встречающиеся в источниках:
Ершникахъ, Ершниковъ, Ершниковой (д-ни) и т.п.
При этом стоит пробовать и версии с заменами твёрдого знака на “ь”, “з”, “г” — иногда OCR распознаёт именно так.
Поиск по частям слова и комбинациям
Иногда ошибок в распознавании слишком много, или слово “разорвано” переносом на новую строку. В таких случаях помогает поиск по частям слова со звёздочкой (*) и сочетаниями.
Однако важно знать: на archive.org поиск с “*” не работает так гибко, как в Яндексе. Если просто ввести часть слова со звёздочкой, сайт найдёт только урезанные фрагменты — без вариантов окончаний.
Чтобы получить корректные результаты, используйте вот такой шаблон:
⚜️https://archive.org/search?query=collection%3Arussianempiregenealogyresources+AND+%D0%A8%D1%82%D1%80%D0%B0%D0%BB%D1%8C*+AND+%D0%BB%D1%8E%D0%B4%D0%B2%D0%B8%D0%B3*&sin=TXT
Замените выделенные слова на свои ключевые.
Звёздочка добавляется без пробела, прямо к части слова.
Между словами обязательно ставьте пробел.
Если используете комбинацию нескольких слов — пишите AND только заглавными буквами.
Эффективный поиск по archive.org, изображение №3
Если вы хотите попробовать комбинацию из 3-х и более слов, добавляйте новую AND для каждого дополнительного слова
Эффективный поиск по archive.org, изображение №4
Если вы ищите делаете поиск по одной части слова, достаточно такой комбинации:
Эффективный поиск по archive.org, изображение №5
Добавка AND помогает находить оба слова в одном тексте, однако работает она не всегда стабильно: среди результатов встречаются как страницы, где есть оба слова, так и те, где найдено только одно из них.
Тем не менее, такой способ всё же даёт больше полезных совпадений, чем поиск по одному слову, и в моём случае позволил быстрее выйти на нужные документы.
Но это не единственный нюанс при поиске со звёздочкой. Найти книгу - это только часть дела. Важно уметь искать внутри самой книги, так как нужное искаженное упоминание может быть спрятано где угодно.
Когда мы искали по полному слову, система сразу открывала страницу с найденным фрагментом. Вот пример:
Эффективный поиск по archive.org, изображение №6
Но когда мы ищем со звездочкой, оказываемся в любой части книги с таким результатом:
Эффективный поиск по archive.org, изображение №7
Чтобы найти нужный фрагмент внутри книги, посмотрите на превью с результатом поиска и скопируйте искажённый вариант слова прямо оттуда.
Можно скопировать не само искомое слово, а любое соседнее, например — «Порузикъ», главное — попасть в нужный участок текста. Это позволит быстро найти место, где действительно встречается нужное упоминание, даже если распознавание сильно искажено.
Эффективный поиск по archive.org, изображение №8
И затем ввести это слово в поиск по книге:
Эффективный поиск по archive.org, изображение №9
Ещё один способ — поиск по комбинациям целых слов, взятых в кавычки.
В этом случае система найдёт только те отрывки текста, где встречается точное соответствие этим словам.
Пример запроса:
⚜️https://archive.org/search?query=collection%3Arussianempiregenealogyresources+AND+%22%D0%A8%D1%82%D1%80%D0%B0%D0%BB%D1%8C%D0%B1%D0%BE%D1%80%D0%BD%22+AND+%22%D0%BB%D1%8E%D0%B4%D0%B2%D0%B8%D0%B3%1%22&sin=TXT
Эффективный поиск по archive.org, изображение №10
Я пользуюсь этим методом редко, потому что нужные мне слова чаще всего распознаются с ошибками.
Еще один способ поиска для редких ключевых слов с уникальным написанием - по второй части слова, чтобы учесть случаи переноса слова на новую строку, например поиск борнъ, борнь или зини, для фамилий Штральборн и Рионзини, вот пример:
⚜️https://archive.org/search?query=collection%3Arussianempiregenealogyresources+%D0%B7%D0%B8%D0%BD%D0%B8&sin=TXT
Тем не менее, благодаря ему я нашла десятки интереснейших фактов о помещиках и их имениях. Позже некоторые из них я опишу подробнее, а пока хочу привести несколько особенно запомнившихся примеров.
Одно из самых трогательных и необычных — дело 1842 года из сенатских объявлений во Владимирскую палату гражданского суда:
30545. Поручица Прасковья Иванова фон-Штральборнь, а в случае смерти ея, наследники или их поверенные, по делу о взыскиваемых с нее фон-Штральборн Владимирекою мещанкою Прасковьею Федоровою Друговою деньгах 240 р. асс. за обучение дворовой ея фон-Штральборнь девки Прасковьи Ефимовой шитью в пяльцах.
Одно из самых ценных для меня — дело о моих предках и их трудном положении, постановление 1862 года о количестве и составе оброка, включая женщин. Это редкий случай, когда суд справедливо защитил права крестьян.
V. Читано было прошение помещицы ротмистрши Ирины Ивановой Штральборн, в коем объясняет, что за крестьянами, поселенными на её земле и деревнях: Ершниках, Уставской и Сумарокове, состоит оброчная недоимка: Родионом Васильевым за прежнее время 15 руб., обще с братьями Федором и Иваном за 1861 год 50 руб., за последним корчемные за землю 7 руб., за Тихоном Афанасьевым за прежнее время 5 руб. и за 1861 год 20 руб., за Иваном Михайловым за 1860 год 20 руб. и за Петром Максимовым с отцом 25 руб., за Григорием Лаврентьевым за 1861 год 20 руб. и за Алексеем за 1861 год 10 руб., всего 192 руб. серебром — все они пользуются землею. Кроме того, не внесли холщового оброка за 1860 год — по 20 аршин женщины. О взыскании с означенных крестьян как оброчных, так и за холст денег она обращалась к г. мировому посреднику 2 участка, который уведомил её, что деньги с некоторых крестьян будут взысканы, но между тем до сего времени не получает их, тогда как срок платежа долга Опекунскому Совету (внесение платежа по кредиту самой помещицы) за 1861 год истекает, почему и просит сделать распоряжение о взыскании с крестьян оброка и ей, по месту жительства, объявить. При чём мировой посредник г. Полубояринов объявил, что для уплаты состоящей на крестьянах недоимки, хотя им и вручено Ростовскому Земскому Суду описать у них имение, но при описи оказалось, что описанное имущество недостаточно для покрытия недоимки, а что отдача в заработки некоторых недоимщиков невозможна — за старостью, совершенной неспособностью к работе, по причине слепоты (!). Мировой Съезд необходимым нашёл рассмотреть по ревизской сказке лета крестьян, за которыми состоит недоимка, и оказалось, что из 22 душ могут платить оброк только 7 душ. И что недоимка большей частью состоит за стариками, а потому ОПРЕДЕЛИЛ: пригласить помещицу Штральборн исключить из недоимки оброк, состоящий за такими крестьянами, которые не в состоянии уплатить оный по старости и совершенной невозможности к работе; с прочих же предоставить г. мировому посреднику принять законные меры взыскания. Что же касается до сбора холста за 1860 год, то объявить ей, что таковой сбор, по силе 5 ст. Правил о порядке приведения в действие Положения, не может быть произведён, как отменённый.
Желаю всем удачи!
https://vk.com/@alexf83-effektivnyi-poisk-po-archiveorg
Р-655, оп. 1, д. 117/990 Судаков - ВокнаволокНА РК ф.24, оп. 10, д.3/71 Дело об отграничении земельного и лесного наделов для крестьян Пергубского общества Шунгской волости Повенецкого уезда. Карта 15 июня - 16 августа 1881 г. (65л)
НА РК ф.24, оп. 10, д.3/84 Дело об отграничении земельного и лесного надела для крестьян Повенецкого уезда Шунгской волости Кяпписельгского общества селений Кяппесельги, Савассельги, Шайдомы, Рекшиной горы и других. Карта. 10 июня - 24 декабря
1882 г. (87л)
НА РК ф.4, оп. 45, д. 11/117 - ПС Толв вол 1826г да и сам фонд интересный
В настоящее время информационные базы архивов содержат сведения о жителях Санкт-Петербурга/Петрограда/Ленинграда за период 1900-1924 г.г.
1. Идем сюда https://clck.ru/3CtJbJ
2. Нажимаем красную кнопку "Поиск сведений"
3. Авторизуемся через Госуслуги или архивную систему
4. Ищем нужные записи.