Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
gbyudby Москва Сообщений: 1643 На сайте с 2020 г. Рейтинг: 889 | Наверх ##
23 мая 2024 15:45 23 мая 2024 15:48 platonshukin написал: [q] стало ли лучше?[/q]
нашел ф.50 вручную - да, в частности сходу оп.1 т.1 пошло полноценное распознавание кириллицей спасибо )) п.с. и тут же персональное дело нашлось, хотя тому назад читал все описи вручную ну, неоднократно уже сталкивался, что мой ИИ в виде органов зрения, отстает пока от ИИ яндекса )) | | Лайк (1) |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
23 мая 2024 15:57 gbyudby написал: [q] platonshukin написал:
[q] имеете в виду.
[/q]
раньше фонды на странице шли по порядку, теперь - как картинке, вперемешку как найти ф.50 ? видимо, вручную, когда открываешь любой фонд - в командной строке нет его номера[/q]
Понял. Простите, обновляем счетчики по всем архивам, при этом временно ломается порядок. Скоро все починится. | | Лайк (6) |
gbyudby Москва Сообщений: 1643 На сайте с 2020 г. Рейтинг: 889 | Наверх ##
23 мая 2024 16:45 platonshukin написал: [q] обновляем счетчики по всем архивам[/q]
спасибо! а может ИИ еще заняться ЦГАМ ф.32 опись 7, опись 13 тома 1, 2 и 3 ? тоже рукописные, и тоже не расшифрованы | | |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
23 мая 2024 23:14 23 мая 2024 23:14 platonshukin написал: [q] обновляем счетчики по всем архивам, при этом временно ломается порядок.[/q]
Ну вот, наконец по ЦГА Москвы правильное количество дел отображается. Раньше Яндекс очень долго завышал количество дел. Я об этом неоднократно писал. Потом Яндекс что-то поменял и, как ни странно, начал занижать количество дел. По ЦГАМ разница была около 30 дел. Теперь Яндекс пишет, что у него 20075 дел Московского архива, а epoisk уже месяца два назад показывал, что на Яндексе 20073 отсканированных дела. Сейчас разница в 2 дела, но я знаю откуда она. Это уже мой косяк - позже поправлю. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (5) |
von_nachtigallPh.D. (Chem.)  Москва => не Москва Сообщений: 1911 На сайте с 2010 г. Рейтинг: 1944 | Наверх ##
24 мая 2024 11:26 von_nachtigall написал: [q] Сообще уважаемому platonushkin об одной неприятной особенности мобильной версии поиска. Если после установки фильтров и совершенного поиска в строке поиска снова написать что-то и поискать снова, то все фильтры обнуляются. В полной версии (десктопной) этого нет.[/q]
Не знаю, что там поменялось - только фильтры теперь начинают слетать аналогичным образом и в десктопной версии --- Ik bun Normalis Archivaris
En ik beitel kronieken in een rots...
Ich fahre hier,
Ich fahre her
Ich habe keine Heimat mehr
R-M198, U7a (FTDNA); R-Z92, U7 (23&Me) | | Лайк (3) |
emelen Новичок
Москва Сообщений: 12 На сайте с 2020 г. Рейтинг: 10 | Наверх ##
25 мая 2024 9:47 в саратовском архиве тоже 0 дел, появятся ли --- николаевский уезд село Благодатовка, Большая Глушица Харлашины, Берлизовы, чувашины | | Лайк (4) |
tirael Подмосковье Сообщений: 802 На сайте с 2023 г. Рейтинг: 1633 | Наверх ##
25 мая 2024 19:59 27 мая 2024 20:27 Уважаемый platonshukin. Работая с МК ЦГАМ обнаружил, что некоторые сканы перевернуты вверх ногами. Возможно ли их перевернуть в нужную ориентацию на сайте Яндекс.Архивы, поскольку нейросеть пока еще, наверное, не умеет распознавать перевернутый текст? Планируется ли сделать в дополнение к кнопкам масштабирования еще и кнопки поворота для таких случаев: https://yandex.ru/archive/cata...27ef4f/144 ? Здесь и далее 8 разворотов идут перевернутые, работать с такими документами невозможно. --- Ищу сведения: Хижниковы,Хижняковы,Хижинковы (ст.Новочеркасская), Бродские (Одесса, Туркестанский край), Погореловы (Воронеж. губ до1925, Крым/Кубань с1925, Ленинград с 60х), Саватеевы/Савватеевы (Владимирская губ, Москва и обл. Кулебякино), Моисеевы (Рязанская губ. с. Добрые пчелы) | | Лайк (3) |
Majata Новичок
Сообщений: 7 На сайте с 2024 г. Рейтинг: 3 | Наверх ##
27 мая 2024 14:02 Добрый день! Есть ли в планах добавить в Поиск по документам архив Курской области? | | Лайк (1) |
burlayfo Москва Сообщений: 1888 На сайте с 2012 г. Рейтинг: 994
| Наверх ##
27 мая 2024 14:10 27 мая 2024 14:10 Кто в курсе , после загрузки файлов на Яндекс Архиве, искусственный интеллект как быстро обрабатывает эти тексты ? По Оренбургу почти 100 % разместили, а поисковик показывает на 10.03.2024 по запросу Логачёвка Дергилёв -открывает 21 результат. на 26.05.2024 г на тот же запрос -выдает 30 сканов на 3-х страницах.
--- Дергилёвы, Бантюковы -Старооскольский уезд,Бузулукский уезд, Новосёловы, Созиновы - Котельнический уезд, Савельевы - Михайловский уезд , Ягловские, Каспержик - Минск-Литва -Польша, Архиповы - Казанская губерния.
| | |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
27 мая 2024 14:49 burlayfo написал: [q] Кто в курсе , после загрузки файлов на Яндекс Архиве, искусственный интеллект как быстро обрабатывает эти тексты ? По Оренбургу почти 100 % разместили, а поисковик показывает на 10.03.2024 по запросу Логачёвка Дергилёв -открывает 21 результат. на 26.05.2024 г на тот же запрос -выдает 30 сканов на 3-х страницах.
[/q]
Обычно сканы распознаются и добавляются в поиск на следующий день после их появления на сервисе. Если за раз загружено больше 200 тыс сканов - может занять чуть больше. Но сейчас нераспознанных сканов на сервисе нет. А вы ожидали, что по [Логачёвка Дергилёв] будет больше результатов? Или есть примеры документов, где эти слова есть (именно в расшифрованном тексте), а в результатах поиска их нет? Если такое обнаружится - пожалуйста, напишите в https://ya.ru/archive/feedback , будем разбираться. На всякий случай напишу очевидное: фамилия и название могли распознаться неправильно; напр., сейчас сходу нашел один результат по запросу [Рергилев] и два - [Бергилев]. Может быть, с этим связано то, что вы не находите ожидаемого. | | Лайк (4) |
|