Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
gbyudby Москва Сообщений: 1643 На сайте с 2020 г. Рейтинг: 889 | Наверх ##
5 мая 2023 18:30 продолжу на тему пожелания читателей.. ЦГАМ ф.1472, очень хочется, пока ни одного дела из 66 доступных на сайте архива )) | | Лайк (4) |
Sinterson Москва Сообщений: 515 На сайте с 2015 г. Рейтинг: 342 | Наверх ##
7 мая 2023 8:44 У меня капча вылазит постоянно. Нет ни впн, на надстроек у браузера. Но это все мелочь с учетом того, что он действительно помог найти рождение брата прабабушки, что родилась не как все в Возцах, а в Озерах. Плюс на днях загрузили метрики из Новгородского музея-заповедника. Такого счастья я вообще не ждал --- Интересует духовенство Новгородской губернии: Новая Русса, Черенчицы, Ляховичи, Левоча, Строилово, Молвотицы | | Лайк (5) |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
10 мая 2023 0:34 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (4) |
gbyudby Москва Сообщений: 1643 На сайте с 2020 г. Рейтинг: 889 | Наверх ##
12 мая 2023 23:37 по ЦГАМ продолжается наполнение - не по дням, а прям по часам)) но вроде как в основном ф.203 оп.780 а как бы "добить" ф.203 оп.745 ? ЦГАМ выложил 640 дел https://epoisk.ru/?fond=203&am...&efp=1в яндексе доступно 586 дел, разрыв - совсем небольшой, но - он есть ))) | | |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
13 мая 2023 11:44 gbyudby написал: [q] по ЦГАМ продолжается наполнение - не по дням, а прям по часам)))[/q]
Наполнение действительно идет полным ходом, но нужно какое-то время обождать, прежде чем проводить поиски по фамилиям итп. Новые дела добавляются, но распознаются не сразу. А сколько они в очереди на распознавание будут находиться, трудно сказать. Может неделю, а может и дольше. К примеру, по ссылке выше дела из фонда 1472 добавлены минимум 5 дней назад, но пока не распознаны. И я предполагаю, что чем больше одновременно новых дел добавляется, тем дольше очередь на распознавание будет обрабатываться. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (8) |
Galo4ka1951 Сообщений: 602 На сайте с 2021 г. Рейтинг: 520
| Наверх ##
13 мая 2023 23:50 xbox написал: [q] но пока не распознаны[/q]
Странно, сейчас поиск по ним есть, возможно не по всем, но уже нашел земляков Боровских --- Поиски: Калужская губ. Боровский и Козельский у.: Алешины 1870-1925гг., Владимир Николаевич ~1882гр и его дети.
Поиски: Боровский уезд: Климовы(д.Редькино), Симоновы(д.Тишинка-д.Редькино), Хромовы(д.Балабаново) | | |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
13 мая 2023 23:55 Galo4ka1951 написал: [q] Странно, сейчас поиск по ним есть, возможно не по всем, но уже нашел…[/q]
Сейчас поиск по указанным делам есть. Вчера его не было. Это естественный процесс. Дела загружают, ставят в очередь на расшифровку, не сразу, но через какое-то время по ним начинает работать поиск. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (3) |
Alena_Sch Сообщений: 986 На сайте с 2020 г. Рейтинг: 764 | Наверх ##
14 мая 2023 6:51 14 мая 2023 7:03 xbox написал: [q] Дела загружают, ставят в очередь на расшифровку, не сразу, но через какое-то время по ним начинает работать поиск.[/q]
А когда (по какой причине) поиск заканчивается? Т. е. перестает находиться информация. По какой причине ЯА перестаёт находить то, что выдавал при поиске ранее? Мне на фамилию, в самом начале работы поисковика (февр), предлагал только одну запись в МК. В последствии она пропала и теперь выдаёт ноль результата. P. S. Видела на форуме, что не только у меня такая история. P. P. S. Про капчу промолчу. Чтобы пробиться и удостовериться в нулевом результате (вдруг напрасно клевещу), кроме ✔️, три раза (все таки 6 утра) неправильно набирала на смартфоне предлагаемый бессмысленный текст. | | Лайк (1) |
Kreutzer Сообщений: 325 На сайте с 2023 г. Рейтинг: 124
| Наверх ##
14 мая 2023 12:32 Поиск конечно стоило бы разделить: Нас пункт Имя Фамилия
Как на ФС
ИИ, распознавая запись, может сам отмечать в ней эти данные. Может сам создавать учетные карточки на каждого человека, выстраивать связи.
Потом. Ну понятно, что одна и та же деревня в пределах прихода - везде одна и та же, после распознавания ИИ не должен оставлять ее в кривом виде, а должен, зная о какой деревне речь, производить замену. Батюшки одни и те же в книгах, но везде разные по распознаванию и пр. | | Лайк (3) |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
14 мая 2023 15:49 Kreutzer написал: [q] Поиск конечно стоило бы разделить: Нас пункт Имя Фамилия[/q]
Еще можно было бы добавить фильтрацию по типу записи "ч1 - Рождение / ч2 - Браки / ч3 - Смерти". Мне этого часто не хватает. Например, нужно найти брак женщины. Её могли выдать куда угодно. Если вводить ее фамилию, то будет тысяча найденных записей о рождении итп. А если бы отфильтровать только по бракам, то теоретически из тысячи останется только треть записей, а практически это будет десятая часть записей. Тогда легко найти невесту, её новую фамилию и новое место жительства. Выделение названия населенного пункта, имени и фамилии из распознанного текста, наверное, решаемая задача, но не такая непростая, как кажется Например, "Иванов" - это может быть неправильно распознанное имя Иван, это может быть отчество, это может быть и фамилия, и это может быть населенный пункт (Иваново). Это самый простой пример, но есть много фамилий или имен, которые совпадают с названием уезда, населенного пункта, прихода итп. Если ИИ неправильно распознает категорию слова, то три поисковых поля для пользователей могут ухудшить общий поиск. Например, Вы ищите фамилию Покровский. Если будете вводить ее в поисковое поле "Фамилия", то часть записей пройдет мимо вас, потому что ИИ часть фамилий Покровский неправильно отнес к населенному пункту. И тогда вам придется делать три поиска. Сначала вводить фамилию в поле "фамилия. Просматривать несколько сот записей. Потом на всякий случай вводить тоже самое в поле "населенный пункт" итп. Чтобы ИИ мог правильно разносить данные, сначала он должен научиться распознавать текст почти безошибочно, а этого пока нет. А вот распознать тип записи (рождение/брак/смерть) - это для ИИ элементарная задача, особенно для записей метрических книг после ~1820х годов. Почти все метрические книги идентичны. Есть условно пара десятков шаблонов страниц. На каждой странице в одном и том же месте печатным шрифтом написано "о рождении" / "о смерти" итп. По сравнению с распознанием рукописного текста, определение типа страница по заголовку, - это просто. И если появится дополнительно такой фильтр по типу записи, он никак не может ухудшить поиск. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (12) |
|