Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
TatyanaEgorova Рязанская область Сообщений: 1282 На сайте с 2021 г. Рейтинг: 1111
| Наверх ##
6 марта 2023 20:13 Kreutzer, так по закону же ранее 100 лет ЗАГС не имеет права давать информацию без подтверждения родства. Для архивов 75 лет. А Вы 70 хотите... --- Ищу сведения об Остроумовых, Протопоповых, Беляевых, Благовещенских, Сретенских, Стрельцовых, Воскресенских (СЦС Москвы и Моск. губернии), а также Цховребовых (Юж. Осетия), Трифоновых и Кониных (Тульская губ.) | | Лайк (1) |
gbyudby Москва Сообщений: 1665 На сайте с 2020 г. Рейтинг: 895 | Наверх ##
9 марта 2023 19:21 Коллеги, так будем тут разбирать отдельные казусы, как методический материал для "тренировки нейросети" ? )) подумал, а почему яндекс не находит известные мне записи в ф.2128 ? вот к примеру https://yandex.ru/archive/cata...41b98bb/96л.93 верхний абзац написано "...понял за себя тогож Лавры Успенского прихода умершего крестьянина Егора Лукьянова Окользина дочь девицу Анну Егорову..." яндекс-расшифровка " .. понялъ за себя тогожъ маври кспенскаго прихода умеръ шаго у рестьянина страницы вѣра мужискова о коварина дочь девица анну Егорову.." прикол в том, что если в поиск поставить Коварин - конечно же появляется в результатах поиска )) | | Лайк (4) |
Catabela Москва Сообщений: 152 На сайте с 2019 г. Рейтинг: 100 | Наверх ##
10 марта 2023 16:59 «Поиск по архивам» на Яндексе. Именно поиск по запросу, а не постраничный просмотр сканов. Личный опыт работы с Оренбургским архивом. Найти удалось и немало. В прямом смысле, ситуация меняется каждый день и появляются новые документы и ИИ распознаёт всё лучше, поэтому говорить о том, что поиск хоть по какой-то персоне завершён нельзя, снова и снова нужно смотреть одних и тех же. Самым полезным оказался поиск просто по фамилии, он самый долгий и кропотливый, зато самый результативный, опять же пришлось отказаться от * и «». Но обо всём по порядку.
1 — поиск по населённому пункту и фамилии оказался самым неэффективным. Названия посёлков Неплюевский, Княженский и особенно Фершампенуаз оказались сложны для нейросети. Кроме того, в середине ХIХ в. на Новой линии в Оренбургской губернии не завершился ещё процесс массового переселения и казаки могут числится в других посёлках и приходах. Неплюевские Шеметовы сначала Краснинские, к примеру.
2 — поиск по имени и фамилии достаточно хорош, но пять же сложные имена программой не читаются и не выдаются. Например, самый первый поиск «Северьян Мурзин» не дал ничего, на «Северьян Петрович Мурзин» тоже ноль, зато на запрос «Пётр Мурзин» нашёлся именно Северьян написанный «Сиверьян Петров Мурзин», через неделю появился вариант «Северiанъ», а потом появился с ошибкой писаря, да-да, ошибка в самой метрической книге, тот же самый Северьян записанный как «Савастіянъ» (то, что это ошибка уже проверено с помощью других документов).
3 — поиск по фамилии сродни просмотру всех страниц, выдаётся очень много результатов и большая часть совершенно не нужны, но именно это позволяет найти максимум. Особенно удачно это работает с исповедками, уже упомянутые Пётр Мурзин и его сын Северьян точным поиском в исповедках не находились, а поиск по фамилии выдал отца Пётра (который ранее был неизвестен) — Филиппа, и вот уже внутри семьи оказались все. В целом показалось, что ИИ фамилии читает лучше чем имена.
На данный момент только с помощью запросов удалось найти рождение прапрабабки, на которое ранее были безрезультатно потрачены деньги и время в АИС ОГАЧО (не был известен приход), найдено много рождений непрямых предков, найдено ранее неизвестное место проживания и соответственно появились более ранние предки, три ветки уверенно ушли в середину ХVIII века, найден брак 3прадеда и появилась новая девичья фамилия, найдено рождение 4прадеда и появилось имя и отчество его матери. По запросу только на фамилию неплохо проработались исповедки и появилось много боковых веток. А найти точные сведения в метриках опять же по минимальным данным, либо имя и фамилия, либо только фамилия, получилось ограничив даты в поиске (Екатерина Орлова быстро нашлась по запросу отца Василия Орлова и «вилкой» дат). | | Лайк (19) |
Dmitry Kudinov Одинцово, Московская область Сообщений: 494 На сайте с 2003 г. Рейтинг: 373 | Наверх ##
15 марта 2023 7:12 За последние дни существенно пополнилось количество отсканированных документов в ЦГА Москвы. Можно ли как-то отслеживать, что именно добавлено? | | Лайк (1) |
Alexander G Сообщений: 1000 На сайте с 2005 г. Рейтинг: 4955 | Наверх ##
15 марта 2023 11:14 15 марта 2023 13:03 Только сегодня нашел эту тему. Фантастика! У меня одна из веток древа попала в Москву. Приходов здесь сотни и искать десятилетиями не имело смысла. И утром одним кликом (!) нашел бракосочетание предков. Это позволит продолжить поиски.
Конечно, много ошибок в распознавании слов. Поэтому искать по такой расшифровке будет затруднительно. Чтобы я предложил.
Был на Яндексе такой проект Народная карта. Каждый мог нарисовать карту своей местности. Я с детьми и племянниками нарисовал карту нашего дачного поселка (с нумерацией домов) и окрестности с дорогами и тропинками. И вот в один прекрасный момент Яндекс подключает народное творчество к своему сервису Яндекс.Карты. Теперь все могут задать поиск места назначения хоть в глуши тараканьей по навигатору и спокойно доехать (важно для скорой помощи, например).
Так вот. Почему бы не сделать тоже самое в этом проекте. Есть распознанный проиндексированный текст. С ошибками (например, в моем случае слово Секретарь заменили на Священник). Надо дать народу возможность исправить ошибки и создать свою базу данных, более корректную. Что получаем. Двойную индексацию. При поиске можно предложить пользователю по его желанию возможность использовать или нет народную индексацию документов. А можно назначить ответственных модераторов (на каждое Дело ил Фонд), которые будут утверждать вносимые изменения (как делали модераторы в Народной карте).
Еще можно создать к документам дополнительную индексацию по ФИО. Не всегда в документах указывали фамилии или отчества. Можно было бы создать метку с ФИО. А потом подключить все проиндексированные документы к общему поисковику Яндекса и к результатам поиска по ФИО человека подключать сканы архивных документов. Не надо никаких ЭЧЗ, заказов в архивах сканов. Всё и сразу под рукой. Но это уже не допустят архивисты, иначе их бизнес рухнет. | | Лайк (6) |
Catabela Москва Сообщений: 152 На сайте с 2019 г. Рейтинг: 100 | Наверх ##
15 марта 2023 14:31 Появление «Поиска по архивам» на Яндексе значительно увеличило родословное дерево. А сделать работу более эффективной получилось совместив ОГАОО в Яндексе с Башархивом и Справочником Вишневского открыв эти ресурсы параллельно в трёх окнах. Итак, личный опыт. В Яндексе был найден брак 11.07 1845 «Елужащій Казакъ Савастіянъ петровъ мурзинъ холостъ преево славнаго вѣроисповѣданія. Первымъ бракомъ У искай крѣпости Казачья дочь дочь иха Евдокiя Иванова Кочнова. Православнаго вѣроисповѣданія первымъ». Появилась новая фамилия и известно откуда невеста. Искать по крупицам всё про Ивана Кочнева можно долго, Иванов, кстати, может оказаться несколько, а нужен один конкретный. В Справочнике Вишневского указано, что Кочневы жили в нескольких деревнях при крепости, одна из которых деревня Кочнево, в первую очередь смотрим её. На Башархиве открываем ревизию 1834 года по этой деревне и сразу находим Ивана Васильевича Кочнева со всей семьёй, в том числе дочерью Евдокией, получаем его отчество и значит + 1 поколение, сразу узнаём имя матери и других членов семьи. Эта информация упрощает дальнейшие поиски. Дальше одновременно смотрим ревизии на Башархиве по Уйской крепости 1834 и 1816 и исповедки в Оренбургском архиве на Яндексе. И от свадьбы в середине ХIX в. быстро переходим к предкам родившимся в середине XVIII в. Только что найденная Евдокия (а каждый кто ищет, знает какая это радость найти хотя б одну новую персону, а уж женщину с девичьей фамилией тем более) за пару часов работы обретает собственное, хоть и не подробное дерево. Полученный скелет теперь можно дополнять новой информацией и прорабатывать метрики, знание имен, отчеств и пусть примерных дат позволяет делать поисковые запросы более точечными. Само родословное дерево становится более наглядным, гораздо проще исключать однофамильцев и не запутаться.
| | Лайк (2) |
burlayfo Москва Сообщений: 1892 На сайте с 2012 г. Рейтинг: 1001
| Наверх ##
15 марта 2023 15:32 15 марта 2023 15:32 Справочник Вишневского что там? --- Дергилёвы, Бантюковы -Старооскольский уезд,Бузулукский уезд, Новосёловы, Созиновы - Котельнический уезд, Савельевы - Михайловский уезд , Ягловские, Каспержик - Минск-Литва -Польша, Архиповы - Казанская губерния.
| | |
slava_trudu Сообщений: 548 На сайте с 2021 г. Рейтинг: 402
| Наверх ##
15 марта 2023 20:59 обратная связь с этим проектом туго работает.
несколько человек их попросили добавить фильтр по дате добавления документа в базу.
для примера - поиск по ключевым словам выдал 25 записей неделю назад, а сегодня 26. Через неделю он 27 или 30 покажет. и каждый раз вручную отсеивать что добавилось? | | Лайк (3) |
DiMe_KzMУчастник  Козьмодемьянск Сообщений: 77 На сайте с 2019 г. Рейтинг: 43 | Наверх ##
17 марта 2023 13:30 Список архивов дополнился Государственным казённым учреждением Московской области "Центральный государственный архив Московской области"
 --- Ищу информацию о Красильниковых (Козьмодемьянск, Марий Эл), Воздвиженских (с.Кужмара, г.Йошкар-Ола, г.Казань)
Никулиных (с.Владимирское (Марий-Эл) г.Королёв (Московская область) | | Лайк (2) |
Мираж Сообщений: 208 На сайте с 2006 г. Рейтинг: 100
| Наверх ##
17 марта 2023 17:13 17 марта 2023 17:15 29112022 написал: [q] DiMe_KzM Это уже давно. Дел 0
[/q]
Фондов 3 Дел 407 Оцифровано дел 3 Документов 752 - Именно сейчас идёт наполнение... --- Ашукины | | Лайк (3) |
|