Яндекс - «Поиск по архивам»
| Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 101 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
PedigreeResearcher Сообщений: 3559 На сайте с 2020 г. Рейтинг: 1024 | Наверх ##
10 ноября 19:48 В опции "Храмы Москвы" проиндексированны не все церкви. Например, нет уже отсканированной ц. св. Петра и Павла на Калужской Замоскворецкого сорока.
Надеюсь, что обработка и добавление приходов в опции Храмы Москвы в процессе. Попадается много недоработок.
Например, ц. Успения Богородице Троицы Живоначальной в Зубове за 1802 год. Показывает только первый лист (в нумерации АИС номер 75). А между тем, вся метрика присутствует целиком. Листы 76, 77 и т. д. до самого конца.
*** Закончу на позитиве. И в том виде, что есть сейчас, - ценнейший и полезнейший инструмент для генеалогического поиска. Работать стало намного удобнее. --- Ищу родителей (девичью фамилию) Ульяны Матвеевны, жены стольника Тимофея Ивановича Лихарева | | Лайк (3) |
Doble_AnchoУчастник  Москва Сообщений: 53 На сайте с 2025 г. Рейтинг: 34 | Наверх ##
16 ноября 11:08 Andrey Maslennikov написал: [q] Никак люди понять не могут, что распознавания и размечая одну книгу - одним писарем писанную - проще и быстрее и надежнее. Картинки все время разные.[/q]
Тут есть такой нюанс как перепроверка - чтобы убедиться в корректности оцифровки, обычно каждый фрагмент независимо (разными людьми) распознаётся дважды. Поэтому если первый раз вполне могли размещать задания на распознавание всего дела, то второй (проверочный) раз выгоднее не всё дело дать одному человеку, а дать его разным людям и по кусочкам - чтобы второй распознающий не сделал где-нибудь ошибку, совпадающую с ошибкой первого распознающего, привыкнув к стилю писаря. Да, это гораздо трудозатратнее для второго распознающего - но с т.з. точности конечного распознавания - правильнее. Но это только предположения. | | Лайк (1) |
Andrey Maslennikov Москва Сообщений: 4195 На сайте с 2010 г. Рейтинг: 2596 | Наверх ##
16 ноября 11:16 Doble_Ancho написал: [q] Тут есть такой нюанс как перепроверка - чтобы убедиться в корректности оцифровки, обычно каждый фрагмент независимо (разными людьми) распознаётся дважды. Поэтому если первый раз вполне могли размещать задания на распознавание всего дела, то второй (проверочный) раз выгоднее не всё дело дать одному человеку, а дать его разным людям и по кусочкам - чтобы второй распознающий не сделал где-нибудь ошибку, совпадающую с ошибкой первого распознающего, привыкнув к стилю писаря. Да, это гораздо трудозатратнее для второго распознающего - но с т.з. точности конечного распознавания - правильнее. Но это только предположения.
[/q]
Субъективно, но, мне кажется, если два человека будут смотреть одно дело, оба адаптируются под писаря, то результат-то более правильный будет, чем совершенно слепая проверка... Да и процесс идти быстрее будет. --- Уважаемые новички! Пожалуйста, задавайте вопросы на форуме, а не в "Личных сообщениях".
Список фамилий по которым веду поиск: ссылка. | | |
Doble_AnchoУчастник  Москва Сообщений: 53 На сайте с 2025 г. Рейтинг: 34 | Наверх ##
16 ноября 12:20 >> Ответ на сообщение пользователя Andrey Maslennikov от 16 ноября 2025 11:16 Яндексу скорость не важна, важна точность. Вот адаптации под писаря они возможно и хотят избежать. Но вы правы, второму распознающему нужны примеры почерка писаря в страницу-другую, а не в маленький фрагмент. Кстати, ещё идея возникла почему такое может быть: Яндекс дают те фрагменты, в которых у двух распознающих_всё_дело были разночтения. А что для распознающего_маленький_фрагмент нужно привести дополнительные примеры почерка писаря (чтобы было удобнее и точнее) – просто никто не подумал. | | Лайк (1) |
| Рысь Новичок
Санкт-Петербург Сообщений: 4 На сайте с 2005 г. Рейтинг: 1 | Наверх ##
14 декабря 23:04 Подскажите, пожалуйста - на Яндекс.Архивы метрические книги по целому списку церквей в каждой. Как можно определить, к какой именно церкви из списка относится конкретная запись?
 --- Все данные предоставлены мною добровольно, исключительно для поиска родственников.
Ищу: Тамбовская, Воронежская - Черенковы, Татарстан - Самсоновы, Днепропетровск - Шалимовы. | | |
ЛюбчиноваОльга, инженер-строитель на пенсии  Омск Сообщений: 17380 На сайте с 2010 г. Рейтинг: 8822 | Наверх ##
14 декабря 23:09 Рысь написал: [q] Как можно определить, к какой именно церкви из списка относится конкретная запись?[/q]
Пролистать подряд до начала метрики, там на первом листе должно быть название церкви, так же может быть название прихода и на последнем листе метрики, можно листать туда, куда ближе --- Любчин(ов), Пострешкин (Пострехин), Свидерский(ой)(ов), Балов, Самсонов, Тугов, Сухов(ых), Табанаков, Пакулев, Суранов, Потоцкий, Чулков, Черданце(о)в, Кунгуров, Buck, Joa, Brinkmann, Kibbermann, Си(е)дя(е)ков, Шляпников, Вьюков, Булгаков, Рождественский, фон Йорк, Костюков | | Лайк (3) |
| LPP2023 Сообщений: 1102 На сайте с 2023 г. Рейтинг: 572
| Наверх ##
14 декабря 23:31 14 декабря 23:33 Рысь написал: [q] Как можно определить, к какой именно церкви из списка относится конкретная запись?[/q]
А вы откройте дело, там обычно есть содержание | | Лайк (9) |
| SANKO Сообщений: 399 На сайте с 2011 г. Рейтинг: 229
| Наверх ##
16 декабря 21:12 Добрый день! Есть ли алгоритм скачивания документа? Прошу подсказать. Я смог лишь через скриншот это сделать. Качество к сожалению теряется. Заранее благодарен --- Старооскольский у. - Седых, Логачев
Изюмский у. - Девисаров,Седых,Сильченко,Логачев,Дворник,Гальченко,Здельник
Харьковский у. - Гальченко
Сумской у. - Здельник
Стародубский у. - Гребенец,Кобыляцкий,Баль,Гапонов
Сердобский у. - Кульков
Игуменский у. - Шичко
Двинский у. - Вержбицкий | | |
Doble_AnchoУчастник  Москва Сообщений: 53 На сайте с 2025 г. Рейтинг: 34 | Наверх ##
16 декабря 21:16 SANKO написал: [q] Добрый день! Есть ли алгоритм скачивания документа? Прошу подсказать. Я смог лишь через скриншот это сделать. Качество к сожалению теряется. Заранее благодарен[/q]
Попробуйте эту инструкцию. Должно работать. | | Лайк (1) |
LonerDмаленьке вовченятко  из откуда в никуда Сообщений: 467 На сайте с 2013 г. Рейтинг: 519 | Наверх ##
17 декабря 19:13 SANKO написал: [q] Есть ли алгоритм скачивания документа?[/q]
Для скачивания страниц поштучно - есть браузерное расширение https://github.com/marydruzina/yandex-archive-downloaderДля скачивания всего документа - тю-тю. После нескольких листаний страниц вредный яндекс ведь начинает спамить свою капчу, чтобы пользователю было не скучно просто листать. Скрипт можно бы сделать (я почти набросал с помощью чатжпт), но только из-за капчи вся автоматизация летит в тартарарым. --- Дергунов, Дырдин, Добрынин, Богатырев, Орехов, Берескин, Попов и др. аднадворцы - Сошки и округа || Нагорный и Вергун (Городное), Нелипа (Козиевка), Борисенко (Колонтаев), Ростовский (откуда - ?), Лябах (Юсковцы-Андреевка) - Константиновка | Громѣка (Гадяч), Бурдѣй (Перелюб) - Вознесенка | | Лайк (4) |
|