Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
gbyudby Москва Сообщений: 1642 На сайте с 2020 г. Рейтинг: 889 | Наверх ##
26 декабря 2023 18:06 platonshukin написал: [q] описи по этим фондам? Хочется искать только по ним?
[/q]
это стало бы приятным дополнением, чтобы были вкладки "МК" "РС" "ИВ" которые уже есть, и... "РАЗНОЕ". например хотя и щас за пару кликов можно перейти в режим поиска по описям конкретного фонда, очень увлекательно... )) | | |
Shurkincat Участник
Москва Сообщений: 55 На сайте с 2018 г. Рейтинг: 58 | Наверх ##
26 декабря 2023 18:14 26 декабря 2023 18:15 platonshukin написал: [q]
Я правильно понимаю, что речь идет про описи по этим фондам? Самих документов у нас пока нет.
Хочется искать только по ним? или наоборот, убрать их из выдачи? Во втором случае вкладка не поможет, но мы тут попробуем улучшить жизнь пользователей.
[/q]
Хочется видеть отдельно результаты по тому что не является МК/ИВ/РС. . Как написали выше, добавьте вкладку РАЗНОЕ и туда помещайте такого рода док-ты (неважно, описи или сами док-ты) --- Азовцевы, Краснобаевы (Москва), Деевы (Свинино, Тамбовская губ., Касимов, Воронеж, Казань, Москва), Бодякшины, Суродины, Жданкины (с.Пермеево, Нижегородская обл.), Песины (Жлобин, Двинск), Евсеевы (Пенза/Коломна) | | |
Helen V Москва Сообщений: 6030 На сайте с 2016 г. Рейтинг: 2489
| Наверх ##
26 декабря 2023 19:18 Зачем же так сложно... Есть же вкладка Документы и под ней вкладка Дела (чем дела отличаются от документов, знает только яндекс. Хотя, может быть, документы - нереализованный поиск по части дела, по отдельным страницам?) --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | Лайк (1) |
Helen V Москва Сообщений: 6030 На сайте с 2016 г. Рейтинг: 2489
| Наверх ##
26 декабря 2023 19:22 Кстати, где можно посмотреть, какие описи ЦГА Москвы включены в поиск? Извечный вопрос - фамилия не найдена, оттого что ее нет в описях, или оттого, что описи не добавлены в поиск? Тут просьба не писать "вы можете набрать номер интересующего фонда и интересующей описи". Попробуйте сами набрать, и заодно выбрать не один фонд, а пару-тройку (например, все московские университеты). --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | |
Shurkincat Участник
Москва Сообщений: 55 На сайте с 2018 г. Рейтинг: 58 | Наверх ##
26 декабря 2023 19:57 Helen V написал: [q] Зачем же так сложно... Есть же вкладка Документы и под ней вкладка Дела (чем дела отличаются от документов, знает только яндекс. Хотя, может быть, документы - нереализованный поиск по части дела, по отдельным страницам?)[/q]
Всё немножко не так :-) Давайте поясню на своем примере: ищем фамилию "Азовцев" в ЦГАМ. Поиск выдает 73 результата, из них 58 - МК, 0- РС, 4 - ИВ. Вопрос: остальные док-ты это что? А это описи, где в названии дел встречается искомая фамилия, но они идут не как описи, а как дела/документы. Скрин приложил. Поэтому и пожелание, что все такого рода "находки" выложить в отдельную закладку "Разное". --- Азовцевы, Краснобаевы (Москва), Деевы (Свинино, Тамбовская губ., Касимов, Воронеж, Казань, Москва), Бодякшины, Суродины, Жданкины (с.Пермеево, Нижегородская обл.), Песины (Жлобин, Двинск), Евсеевы (Пенза/Коломна) | | Лайк (1) |
Helen V Москва Сообщений: 6030 На сайте с 2016 г. Рейтинг: 2489
| Наверх ##
26 декабря 2023 21:47 Shurkincat написал: [q] ыложить в отдельную закладку "Разное".[/q]
По замыслу яндекса, это и называется "дела". Разве нет? --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | Лайк (1) |
xbox Сообщений: 985 На сайте с 2020 г. Рейтинг: 1955
| Наверх ##
27 декабря 2023 0:20 Helen V написал: [q] Shurkincat написал:[q] ыложить в отдельную закладку "Разное".[/q] По замыслу яндекса, это и называется "дела". Разве нет?[/q]
Что такое дела, трудно понять. Я ввел определенный запрос. Получил на него 16679 результатов. Из них 16624 документы, 8шт фонды, 47шт дела. (сумма сходится) Среди выдачи с фильтрацией "фонды" реально встречаются - описи - "Данных нет" При этом быстрый просмотр всегда пишет "Ошибка при загрузке изображения. Перезагрузить." Среди "Документов" встречаются - описи -метрические книги -ревизские сказки и др. Среди "Дел" встречаются - см. скриншот -разные дела (все подряд) - в том числе метрические книги у которых это указано не только в названии, но и плашка соответствующая висит. И еще в том же фильтре есть две категории "Описи" и "Источники". Там по нулям. В связи с этим некоторая путаница возникает. Боковой фильтр иногда работает примерно так: Чтобы найти дело с Метрической книгой нужно прочитать опись, которая находится в разделе Фонды и отобрать записи по типу "Документы", но и на всякий случай отобрать записи по типу "Дела". Скорее всего так либо фильтровать не будут, либо фильтрация будет не точная. Но я догадываюсь, что большая часть проблемы здесь не в том, что фильтр как-то неправильно работает, а в том, что изначально документы в базу Яндекса попадают и заводятся всегда по-разному. Десяток дел легко правильно завести в базу, а когда какой-нибудь архив пришлет заголовки на 100тыс записей, пару тысяч отсканированных дел, среди которых часть метрические книги, часть непонятно что, часть описи итп. Вот и попадают однотипные дела в разные категории. Я думаю, что с вычислительными мощностями у Яндекса не должно быть проблем, а вот есть ли человеческий ресурс, чтобы раскладывать все многочисленные дела в ручном режиме по полочкам, это вопрос.
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (3) |
Helen V Москва Сообщений: 6030 На сайте с 2016 г. Рейтинг: 2489
| Наверх ##
27 декабря 2023 1:04 xbox написал: [q] Среди "Дел" встречаются - см. скриншот -разные дела (все подряд) - в том числе метрические книги у которых это указано не только в названии, но и плашка соответствующая висит.
И еще в том же фильтре есть две категории "Описи" и "Источники". Там по нулям.
[/q]
Без руля и без ветрил. "Ах, это просто заглушка для будущих дополнений" и т.п. Ощущение, что сами разработчики сайтом в качестве пользователей не пользуются. --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
27 декабря 2023 8:22 Кажется, дискуссия затянулась (больше, чем она того заслуживает), а правильного ответа никто не сказал... На самом деле этот фильтр работает так: - "Документы" - поиск по расшифрованному тексту документов (включая описи) - "Дела" - поиск по заголовкам дел - аналогично "Описи", "Фонды", "Источники" - поиск по названиям описей, фондов и, если кому-то зачем-то понадобится, архивов/библиотек Согласен, непонятно. Хотим переделать (надеюсь, на более понятный вариант).
Еще подробностей для тех, кому интересно: - очевидно, что искать по тексту можно, только если в деле есть сканы, => если выбрать такой вариант, в результатах поиска только дела со сканами. А вот искать по заголовкам можно в том числе по делам, в которых сканов нет, => в результатах поиска оказываются дела с серой "заглушкой" вместо картинки - если в деле нет сканов или если найдена опись/фонд, при попытке их открыть в правой колонке (а не на отдельной странице) показывается ошибка. Технически всё так - подходящих изображений же нет. Но для пользователя неочевидно. Тоже есть задача на то, чтобы это исправить. "Но уже после праздников" | | Лайк (15) |
SlavPo Энгельс Сообщений: 260 На сайте с 2021 г. Рейтинг: 182
| Наверх ##
27 декабря 2023 9:29 >> Ответ на сообщение пользователя platonshukin от 27 декабря 2023 8:22 Скажите а может вы будите выкладывать список дел добавленных, а то пополнение есть, а вот какие дела непонятно, вот вчера было пополнение оренбургского архива, хотелось бы знать. С ув. | | Лайк (1) |
|