Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
PedigreeResearcher Сообщений: 3226 На сайте с 2020 г. Рейтинг: 906 | Наверх ##
26 января 2023 18:41 jrw написал: [q] PedigreeResearcher написал:
[q] Ввод заглавными буквами ничего не дал.
[/q]
У меня вчера получалось.[/q]
Для меня важно, что это и в России глюк. А не только заграницей. VPN, стало быть, пробовать не нужно. | | Лайк (1) |
xbox Сообщений: 996 На сайте с 2020 г. Рейтинг: 1976
| Наверх ##
26 января 2023 18:42 Lieschen написал: [q] jrw написал:[q] Еще проблема - невозможно перелистнуть назад страницу дела, что узнать месяц.[/q]
возможно. В ссылке фонд-дело-опись зашифрованы, а страница указана напрямую. просто меняете последнюю цифру на нужную.
Кстати, можно просмотреть и всю книгу целиком. Например https://ya.ru/archive/catalog/...60f8e24530 Надо нажать на Каталог и выбрать нужный архив - фонд - опись и т.д[/q]
В ссылке номер дела не зашифрован. Там стандартный уникальный идентификатор. А номер страницы в ссылке есть, его можно менять вручную. Также внизу есть "паджинация" - возможность перехода на предыдущие/следующие или произвольные страницы книги. Но паджинация расположена очень не удобно. Если распознанный текст короткий, то ссылки для перехода на другую страницу расположены прямо под сканом книги, а вот если распознанный текст очень длинный, а такое периодически бывает, то ссылки перехода на следующую страницу расположены ниже этого блока. Нужно как минимум долго скролить до них. А в начале я даже думал, что эти ссылки то есть, то нет. Т.е.например, скан страницы на экране занимает 20см по высоте. Справа рядом со сканом может блок с распознаным текстом высотой 50см. И вот в таком случае ссылки паджинации будут расположены ниже нижней границы блока с распознаным текстом. Т.е. в примере на расстоянии 50-20=30см от скана. По-хорошему эти ссылки паджинации вообще бы наверх нужно перенести. Но, если наверху места не найдется, то хотя бы прижать эти ссылки к скану снизу.
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (3) |
jrw Сообщений: 5687 На сайте с 2021 г. Рейтинг: 6145
| Наверх ##
26 января 2023 18:43 PedigreeResearcher написал: [q] Ввод заглавными буквами ничего не дал. Значит буду ждать.[/q]
Я вчера просто заново входил на их сайт с главной страницы и капча на время пропадала. https://ya.ru/archive | | |
xbox Сообщений: 996 На сайте с 2020 г. Рейтинг: 1976
| Наверх ##
26 января 2023 18:47 jrw написал: [q] xbox написал:[q] Текст каптчи можно вводить в любом регистре.[/q] Нет, не срабатывает.[/q]
Вы призываете всех вводить в каком-то определенном регистре. Тем самым людям добавляет дополнительную работу. Я пробовал вводить текст одной каптчи через букву в разных режимах. Вот так "ПаЛуБу ЗнАкоМоЕ" и все проходит. Т.е. регистр не влияет никак. А проблема с частой каптчей есть. Это Яндекс пытается бороться с роботами и неправильно уровень угрозы определяет. Каптчи могут выскакивать в произвольный момент. Иногда через полчаса, иногда через минуту, иногда подряд несколько. Но регистр текста никак на этой не влияет. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (2) | Жалоба (1) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2493 | Наверх ##
26 января 2023 18:51 Что-то ответа нет совсем никакого. Посылала на адрес archive-search-support@yandex-team.ru Наверное и не будет. Процитирую письмо здесь, может, кто будет удачливей меня? Добрый день. Спасибо вам огромное за такой интересный проект. Действительно, стало намного проще читать исторические документы. Можно ли задать вам несколько вопросов? Очень хотелось бы получить на них ответы. Но сначала разрешите дать ссылку на тему на генеалогическом форуме, где обсуждается ваш проект: https://forum.vgd.ru/169/140482/ А вопросы такие: 1. Пользователь с форума пишет: "Уезды и волости расшифрованы правильно, названия деревень исковерканы до неузнаваемости." Может быть, есть возможность составить в помощь нейронной сети географический справочник (совместными усилиями всех неравнодушных к генеалогическому поиску)? И тоже как-то сделать его открытым, опубликовав в интернете. 2. У многих людей хранятся копии исторических документов (метрических книг, исповедных росписей, ревизских сказок и т.д.), полученных разными путями. Например, копии документов, полученные непосредственно из наших архивов. (Так, у меня, например, есть пара клировых ведомостей одного храма Порховского уезда Псковской губернии. Документы из Псковского областного архива). И не только. Есть документы, скопированные с одного сайта (метрические книги). Сейчас эти документы хранятся в Государственном архиве Псковской области (ГАПО). Можно ли попросить вас о том, чтобы создать отдельное хранилище для таких документов, куда можно было бы загрузить документы, с условием, чтобы они всегда были бы открыты для просмотра в Сети всеми желающими. И тоже передать их на расшифровку вашей системе? Это был бы весьма интересный проект. Вопрос с авторскими правами, но давайте тогда открыто обсуждать этот вопрос... Было бы интересно привлечь и Росархив к этой дискуссии. Лично я придерживаюсь той точки зрения, что все эти документы - наше общенациональное историческое достояние и должны быть в открытом и бесплатном доступе. 3. Не планируете ли вы сделать некоторую программу для построения генеалогических деревьев (вашей системой или силами зарегистрировавшихся пользователей)? Например, в разрезе отдельных населенных пунктов (это можно было бы привязать к географическому справочнику, о котором я упоминала в первом пункте). Туда же в дальнейшем можно было бы добавить пользователями своих собственных документов (например, фотографии некрополя или копий других архивных документов). 4. У меня составлен (для себя лично) указатель исторических документов (в основном, метрических книг) в привязке к конкретному храму (Порховского уезда Псковской губернии). В таком виде: год - архив - фонд - опись - дело. Отсортировано в хронологическом порядке. Может быть, можно было бы вдобавок к географическому списку (о котором я упоминала) сделать справочник приходов (храмов) - ведь каждая деревня относилась к какому-то храму. И составить (силами генеалогического сообщества) справочник по архивным документам (метрическим книгам, исповедным росписям, ревизским сказкам и другим), которые хранятся в наших архивах... Сделать некоторую онлайн базу данных исторических документов, с привязкой к конкретному приходу (храму). То есть, нельзя ли как-то расширить проект, чтобы в нем могли принимать участие все заинтересованные, любители и профессионалы генеалогического поиска? Это было бы просто замечательно. Я была бы весьма благодарна вам за ответы. С уважением... --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (13) |
xbox Сообщений: 996 На сайте с 2020 г. Рейтинг: 1976
| Наверх ##
26 января 2023 18:57 PedigreeResearcher написал: [q] Хорошо бы, если была возможность правки. Типа, как во время индексации у мормонов.[/q]
Такая возможность, вероятно, предусмотена, но либо она сейчас отключена для массового использования, либо такая возможность предусмотрена только для "экспертов". А кто может быть экспертом, на данным этапе не указывается. Вот скриншот от самого яндекса. На нем виден процесс разметки текста. Мне кажется я видел вчера еще другой скриншот, где рядом с текстом были карандашики для правки. Но тот второй скриншот возможно убрали, чтобы раньше времени не дразнить народ. Кстати, обратите внимание. Рядом с каждой страницей есть переключатель просмотра "Экспертная" / "Автоматическая". Так вот этот переключатель чаще заблокирован в положении "Автоматическая", но на части страниц он позволяет переключать режим просмотра. Как я это понимаю, там где переключатель разблокирован "эксперты" просматривали текст и возможно вносили правки. Но пока я ни нашел ни одной отличающейся буквы при просмотре в разных режимах.
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (4) |
codenz Рязань Сообщений: 264 На сайте с 2021 г. Рейтинг: 240
| Наверх ##
26 января 2023 20:21 Сегодня попробовал поиск по Фамилии. Нашлись документы, в которых нет заданной мной фамилии. Как оказалось, при просмотре и самостоятельном прочтении текста в документе, фамилия что я искал, вовсе не фамилия, а текс из документа, который автоматически распознает Яндекс. Словосочетание рядом стоящих слов, Яндекс автоматически распознаёт как фамилию. Из-за этого приходится просматривать все, найденные документы. Из восьми. только в одном документе записана искомая мною фамилия. Есть функция сохранить или сохранить как. Но у меня не получилось, сделал скриншот.
 | | |
codenz Рязань Сообщений: 264 На сайте с 2021 г. Рейтинг: 240
| Наверх ##
26 января 2023 20:31 Скрин не читаем, Что-то не так делаю?! ГлавнаяКаталогГБУ "ЦГА Москвы"Фонд №1639Опись №1Дело №67 ИСПОВЕДНАЯ ВЕДОМОСТЬ ТРОИЦКОЙ ЦЕРКВИ 6-ГО ГРЕНАДЕРСКОГО ТАВРИЧЕСКОГО ЕГО ИМПЕРАТОРСКОГО ВЫСОЧЕСТВА ВЕЛИКОГО КНЯЗЯ МИХАИЛА НИКОЛАЕВИЧА ПОЛКА 2-Й ГРЕНАДЕРСКОЙ ДИВИЗИИ ГРЕНАДЕРСКОГО КОРПУСА Архив ГБУ "ЦГА Москвы" Фонд ЦЕРКВИ ВЕДОМСТВА ДУХОВНОГО ПРАВЛЕНИЯ ПРИ ПРОТОПРЕСВИТЕРЕ ВОЕННОГО И МОРСКОГО ДУХОВЕНСТВА. Опись МЕТРИЧЕСКИЕ КНИГИ ПОЛКОВЫХ, ДИВИЗИОННЫХ, ЛАГЕРНЫХ И ДР,ЦЕРКВЕЙ Ефим Алексеев сын Коденцов
 | | |
ozerskaya Калининград Сообщений: 4021 На сайте с 2015 г. Рейтинг: 3574 | Наверх ##
26 января 2023 21:14 codenz написал: [q] Скрин не читаем, Что-то не так делаю?![/q]
Увеличиваете стрелочками, потом прокруткой мыши увеличивается. Проверила Вашу запись. При увеличении качество нормальное. Ефим Алексеев сын Коденцов - внизу справа "Фельдфебели". --- Г. Кролевец, коз.Лисогор, с.Спасское: коз. Говоруха,Городиский,Гудим,Шовкомуд, с.Божок, двор.Еремеев,Мирович,Коропчевский, Майбородов; Стародуб: священ.,учителя Озерский,Соловьянов, купцы Скабертины. | | Лайк (1) |
Den707Участник Пишите по всем вопросам поиска.  Самара Сообщений: 62 На сайте с 2017 г. Рейтинг: 46 | Наверх ##
26 января 2023 21:37 26 января 2023 21:54 Наташа СМ написал: [q] BRBB76 написал:
[q] Как пример откройте ссылку https://ya.ru/archive/catalog/...542b98d6/2 и правой кнопкой мыши, но каждую страницу.
[/q]
Сохраняет пустой файл! Браузер Хром, может от этого зависит?
П.С. При загрузке на форум картинка становится черная, но если нажмете, то увидите, что она белая. Видна даже синяя полоса - выделение текста на сайте Яндекса[/q]
Для браузера Google Chrome и Mozilla Firefox - расширение ImageAssistant Batch Image Downloader в помощь! ССЫЛКА НА УСТАНОВКУ В ГУГЛЕ и ССЫЛКА НА УСТАНОВКУ В МОЗИЛЕПеред следующим шагом, рекомендуется приблизить полностью нужное изображение, чтобы оно быстрее прогрузилось! Далее нужно будет нажать на розовую кнопку IA, установленного расширения, которое должно появится справа сверху в углу браузера, либо найти его в установленных расширениях, выбрать там Extract Current Page - подождать, когда изображение загрузится, после его можно будет скачать в исходном разрешении P.S. Если вдруг изображение сохраняется в формате .txt - просто переименуйте его в .png в конце названия файла, удачи! --- ИЩУ РОДНЮ:
Воронежская - х. Артюхов, сл. Красносёловка, сл. Петропавловка;
Курская - с. Ажово, с. Черневка;
Пензенская - д. Бекетовка;
Самарская - д. Грачёвка, с. Степная Шентала;
Смоленская - д. Леоново;
Ульяновская - с. Мулловка, с. Суходол, пос. Лопата.
ФАМИЛИИ В МОЁМ ПРОФИЛЕ! | | Лайк (8) |
|