Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
djaha Сообщений: 1301 На сайте с 2010 г. Рейтинг: 1010 | Наверх ##
14 февраля 2024 10:43 Intellectual70 написал: [q] Соответственно, обладать необходимой справочно-информационной базой/системой на своей территории существенно надёжнее, чем надеяться на запад[/q]
Ага, надежней некуда: "Крупнейшая интернет-библиотека русскоязычных СМИ Public.ru по сути прекратила существование. С 1 января 2024 года она не обновляется, а услуга доступа к уже имеющемуся электронному архиву не предоставляется. Письменные уведомления об этом получили в том числе петербургские СМИ, находившиеся с Public.ru в договорных отношениях. Как указывается на сайте самой интернет-библиотеки, в ее электронном фонде хранятся материалы российских СМИ с 2000 года, в том числе более 100 миллионов статей, причем ежедневно фонд пополнялся более, чем на 100 тысяч новых файлов. Какова судьба этого уникального электронного архива, на данный момент неизвестно." | | Лайк (3) |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
14 февраля 2024 11:44 oztech написал: [q]
Тогда, уважаемый platonshukin, Вы можете помочь решить эту техническую проблему на сайте ЯА?
[/q]
Да, к сожалению, есть некоторое количество сканов, которые потерялись в процессе передачи от архива к нам или загрузки на сайт. Мы их перезапрашиваем у архива и перезаливаем поштучно. По Оренбургу, например, все такие случаи уже выловили и исправили, ЦГАМ в работе. | | Лайк (16) |
Intellectual70 лейб-гвардеец
Россия Сообщений: 973 На сайте с 2020 г. Рейтинг: 878 | Наверх ##
15 февраля 2024 12:01 >> Ответ на сообщение пользователя djaha от 14 февраля 2024 10:43 В данном случае, можно предположить 2 возможных момента (исходя из даты завершения его работы или приостановки): 1) завершилось финасирование данного проекта; 2) произошло полное наполнение физических накопителей информации. Учитывая слишком большой объём ежедневного наполнения информацией. Но, скорее всего, всё же первое. Вместе с тем, предполагаю, что такое возможно не только в нашей стране. Следует отметить, что новые номера газет/периодики в 18 и 19 веках, уже не будут напечатаны. --- Честь и Слава
Потомок Саратовской ветви князей Енгалычевых
| | |
Kraut Москва-Самара Сообщений: 5281 На сайте с 2010 г. Рейтинг: 2997 | Наверх ##
15 февраля 2024 22:23 15 февраля 2024 22:24 platonshukin написал: [q] По Оренбургу, например, все такие случаи уже выловили[/q]
Да? А как же ф. 173 оп. 15 д. 1737 - нет фф. 108-159, д. 1726 - дело обрывается на половине, д. 1719 - в конце вообще мешанина из разных дел, 1676 - смешано несколько дел, много битых файлов и тп. и тд. --- Кузнецовы (Самарская д.НовоЗапрудное, с. Липовка, с. Дмитриевка, д. Новая Поляна (Лопатино). Скоповы (Воронежская -- с. Пески, д. Мазурка, д. Марьевка Байчурово тож) Кретинины (интересны все, Воронежская обл., Украина - г. Запорожье, Казахстан)
Пугины,Бо | | Лайк (1) |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
16 февраля 2024 22:08 Kraut написал: [q] platonshukin написал:
[q] По Оренбургу, например, все такие случаи уже выловили
[/q]
Да? А как же ф. 173 оп. 15 д. 1737 - нет фф. 108-159, д. 1726 - дело обрывается на половине, д. 1719 - в конце вообще мешанина из разных дел, 1676 - смешано несколько дел, много битых файлов и тп. и тд.[/q]
Я имел в виду конкретно случаи, когда вообще отсутствует изображение, как в примере, который приводили выше. Их несложно обнаружить автоматически. Случаи, про которые вы пишете: перепутаны листы, отсутствуют листы в деле - в основном можно выловить только глазами. Так что спасибо за сигнал, перечисленные дела проверим, а если будут другие "и тп. и тд." - пишите, пожалуйста, в https://yandex.ru/archive/feedback | | Лайк (8) |
Vladimir V Участник
Сообщений: 74 На сайте с 2005 г. Рейтинг: 64 | Наверх ##
17 февраля 2024 13:20 По непонятной причине волшебный яндекс-архив до сих пор не загрузил в свою базу материалы ЦГА Москвы, выложенные более месяца назад, в первой половине января. ЦГА уже февральские дела выложил, а интереснейшие дела января все еще недоступны для поиска. Пичалька... | | Лайк (2) |
7_kolen_predkov ДиВанное заМКАДье Сообщений: 1084 На сайте с 2021 г. Рейтинг: 3515
| Наверх ##
17 февраля 2024 14:27 Vladimir V написал: [q] до сих пор не загрузил[/q]
Может потому, что выложить у себя и передать в надлежащем виде ЯА это разные процедуры? И время еще не настало? [q] 15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник[/q] | | Лайк (3) |
Temych Санкт-Петербург Сообщений: 1138 На сайте с 2010 г. Рейтинг: 652 | Наверх ##
17 февраля 2024 15:20 platonshukin
Объясните, пожалуйста. Почему при запросе "Ныр" и "Нырова" разные результаты? Ведь по логике в запрос "Ныр" должны попадать все результаты, в том числе и более узкого "Нырова". Или я ошибаюсь. Поиск в то же время ограничиваю по архиву (ГАИО) и годам 1800-1820. | | Лайк (1) |
a-KaDeMi-k Сообщений: 1910 На сайте с 2011 г. Рейтинг: 2644 | Наверх ##
17 февраля 2024 15:37 17 февраля 2024 15:39 Temych написал: [q] platonshukin
Объясните, пожалуйста. Почему при запросе "Ныр" и "Нырова" разные результаты? Ведь по логике в запрос "Ныр" должны попадать все результаты, в том числе и более узкого "Нырова". Или я ошибаюсь. Поиск в то же время ограничиваю по архиву (ГАИО) и годам 1800-1820.[/q]
Как одно из предположений, "Нырова" распозналось, как "Ны рова" (с пробелом, с переносом строки и т.п.). Или как "Кырова"/"Керова"/... Проверьте сам распознанный текст. platonshukinБыло бы неплохо добавлять в результаты поиска (с низким приоритетом) альтернативные "прочтения" часто плохо распознающихся букв. Например, "Бырылов"/"Берилов" "Никитин"/Нинитин" "Петюрин"/"Петерин" и т.п. А так же варианты "осовременивания". Например, К "ѣ" возвращать ещё и "е". Так же можно подключить справочник "эквивалентных" имён, в т.ч. "уменьшительных". В поиске запрашивают "Егор" - возвращаются и Егоры и Григории, "Дмитрий" - Митя, Митяй, Митька... Т.е. учесть специфику генеалогических документов. | | Лайк (1) |
romanvm Россия, г. Ефремов Сообщений: 5395 На сайте с 2014 г. Рейтинг: 3400 | Наверх ##
17 февраля 2024 15:38 17 февраля 2024 15:38 Temych написал: [q] Объясните, пожалуйста. Почему при запросе "Ныр" и "Нырова" разные результаты? Ведь по логике в запрос "Ныр" должны попадать все результаты, в том числе и более узкого "Нырова". Или я ошибаюсь.[/q] Правила поиска в архивах Яндекса | | Лайк (2) |
|