Яндекс - «Поиск по архивам»
| Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 101 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (107) |
| dsukharev Начинающий
Москва Сообщений: 30 На сайте с 2018 г. Рейтинг: 29 | Наверх ##
28 декабря 2025 2:48 28 декабря 2025 2:49 romanvm написал: [q] Yulia2005 написал:[q] Но поиск по части слова всё равно не доступен, как я понимаю
[/q] Такого функционала, к сожалению, у них нет.[/q]
Отчего же, есть в каком-то объёме. Проверил на Суха*, Сухар*, Сухан* и пр. - результаты похожи на правду, по крайней мере по кол-ву найденного. К сожалению, предпросмотр в таком режиме не работает, поэтому быстро проверить глазами результаты не получится. С другой стороны, проверил на Петр, Петр*, Петров - действительно, явно не работает как надо. И с Иванами так же, и с Дмитриями, и даже с Анофреями. Предполагаю, это из-за оптимизации поиска по именам. Она всё-таки есть в каком-то виде. С третьей стороны, для воро* - 293К, вороб* - 249К, а ворон* - 515К! Т.е. что-то как-то ищет, но уверенности никакой )) | | Лайк (1) |
romanvm Россия, г. Ефремов Сообщений: 5754 На сайте с 2014 г. Рейтинг: 3697 | Наверх ##
28 декабря 2025 9:12 28 декабря 2025 9:53 >> Ответ на сообщение пользователя dsukharev от 28 декабря 2025 2:48 Что-то как-то ищет - это не функционал, это какое-то подобие. Не более того. --- Вопрошающие, большая просьба - приводите ссылки на документы из общедоступных источников. | | Лайк (1) |
vedra Сообщений: 2047 На сайте с 2015 г. Рейтинг: 4006 | Наверх ##
28 декабря 2025 16:09 Yulia2005 написал: [q] Но поиск по части слова всё равно не доступен, как я понимаю[/q]
Иногда как раз узнает и отыскивает часть слова или сокращения, особенно в ранних документах. Например, поиск по сокращению "вдва" и "кньз" + фамилия искомого выдает единственный результат. Без сокращений - ничего. | | Лайк (3) |
| Yulia2005 Moscow Сообщений: 296 На сайте с 2020 г. Рейтинг: 183
| Наверх ##
28 декабря 2025 22:00 28 декабря 2025 22:11 >> Ответ на сообщение пользователя dsukharev от 28 декабря 2025 2:48 Да, действительно, с кавычками работает, но ненадёжно и через раз | | |
ilitvi Севастополь Сообщений: 151 На сайте с 2022 г. Рейтинг: 171 | Наверх ##
29 декабря 2025 18:43 Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста? Все ведь сталкиваются с "галиматьей" "искусственного интеллекта". Частенько хочется поправить... На FS вполне себе можно исправить ошибки распознавания | | Лайк (4) |
LonerDмаленьке вовченятко  из откуда в никуда Сообщений: 482 На сайте с 2013 г. Рейтинг: 535 | Наверх ##
29 декабря 2025 18:49 ilitvi написал: [q] Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?[/q]
Вряд ли напрямую просто так разрешат. Но добавили задачи по распознаванию на Яндекс.Задания. Могли бы сделать хоть возможность пометить в "Поиске по архивам" неправильно распознанные строки, и эти фрагменты отправляли бы в свои Задания. --- Дергунов, Дырдин, Добрынин, Богатырев, Орехов, Берескин, Попов и др. аднадворцы - Сошки и округа || Нагорный и Вергун (Городное), Нелипа (Козиевка), Борисенко (Колонтаев), Ростовский (откуда - ?), Лябах (Юсковцы-Андреевка) - Константиновка | Громѣка (Гадяч), Бурдѣй (Перелюб) - Вознесенка | | Лайк (4) |
ilitvi Севастополь Сообщений: 151 На сайте с 2022 г. Рейтинг: 171 | Наверх ##
29 декабря 2025 20:23 LonerD написал: [q] ilitvi написал:
[q] Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?
[/q]
Вряд ли напрямую просто так разрешат. Но добавили задачи по распознаванию на Яндекс.Задания. Могли бы сделать хоть возможность пометить в "Поиске по архивам" неправильно распознанные строки, и эти фрагменты отправляли бы в свои Задания.[/q]
Честно говоря, пометки о неправильном распознавании сделали бы сайт похожим на дневник двоечника. Весь в красных чернилах. Мало что распознано правильно по моим наблюдениям. Отдельные читаемые фрагменты. Но мысль неплохая. Не знаю как сейчас, но раньше никакое распознавание не обходилось без "ручного труда". | | Лайк (1) |
Doble_Ancho Москва Сообщений: 111 На сайте с 2025 г. Рейтинг: 52 | Наверх ##
30 декабря 2025 20:29 30 декабря 2025 20:29 ilitvi написал: [q] Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?[/q]
Они уже позволяют это делать: можно отправить ссылку на фрагмент (1) по форме "обратная связь" (2). Я пробовал, исправляют.
 | | Лайк (10) |
| Shurkincat Участник
Москва Сообщений: 59 На сайте с 2018 г. Рейтинг: 62 | А что у нас сегодня с выдачей творится? Набираешь запрос, жмешь ввод - 200 результатов, жмешь "обновить" в браузере - 202, еще раз обновляешь - 204, потом 198.. и так без конца... --- Азовцевы, Краснобаевы (Москва), Деевы (Свинино, Тамбовская губ., Касимов, Воронеж, Казань, Москва), Бодякшины, Суродины, Жданкины (с.Пермеево, Нижегородская обл.), Песины (Жлобин, Двинск), Евсеевы (Пенза/Коломна) | | Лайк (1) |
южа Екатеринбург Сообщений: 1067 На сайте с 2008 г. Рейтинг: 10107 | Наверх ##
1 января 14:25 1 января 14:26 Shurkincat 31-го там мощно загрузили доки НА Республики Адыгея (НАРА), в т.ч. и МК. У меня тоже после этого стали глюки. Вероятно после этого народ уже ушел отмечать - и стало не до "надзора и правки" сайта. --- | | Лайк (2) |
|