Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
Sergey_F Сообщений: 280 На сайте с 2014 г. Рейтинг: 152 | Наверх ##
8 марта 2024 16:42 Коллеги, мне сказали, что есть расширение браузера для скачивания картинок с Яндекс Архивов, подскажите, где его можно загрузить. | | |
romanvm Россия, г. Ефремов Сообщений: 5394 На сайте с 2014 г. Рейтинг: 3397 | Наверх ##
8 марта 2024 17:10 Sergey_F написал: [q] Коллеги, мне сказали, что есть расширение браузера для скачивания картинок с Яндекс Архивов, подскажите, где его можно загрузить.[/q] Здесь | | Лайк (1) |
D_SK Участник
Москва Сообщений: 80 На сайте с 2009 г. Рейтинг: 75 | Наверх ##
8 марта 2024 17:11 Sergey_F написал: [q] Коллеги, мне сказали, что есть расширение браузера для скачивания картинок с Яндекс Архивов, подскажите, где его можно загрузить.[/q]
Если это документы ЦГАМ, то прекрасно скачивается непосредственно с их сайта (и не нужно никаких расширений)! | | Лайк (2) |
von_nachtigallPh.D. (Chem.)  Москва => не Москва Сообщений: 1913 На сайте с 2010 г. Рейтинг: 1946 | Наверх ##
8 марта 2024 17:45 Sergey_F написал: [q] он будет искать по образам. Сейчас это бесплатно.[/q]
и безрезультатно --- Ik bun Normalis Archivaris
En ik beitel kronieken in een rots...
Ich fahre hier,
Ich fahre her
Ich habe keine Heimat mehr
R-M198, U7a (FTDNA); R-Z92, U7 (23&Me) | | |
xbox Сообщений: 992 На сайте с 2020 г. Рейтинг: 1968
| Наверх ##
8 марта 2024 23:03 8 марта 2024 23:12 Новая фича Яндекса при поиске по отсанированной описи, на мой взгляд, не совсем корректно сделана.Прошу сотрудников Яндекса на это обратить внимание и как-то адаптировать нововведения, чтобы они не ухудшали поиск. Раньше была очень удобная возможность искать текст в отдельной отсканированной описи.Например, берем Опись1 фонда 520 ЦГА Москвы. Открываем ее по ссылке https://ya.ru/archive/catalog/...rySheets=1Видим саму опись, в которой всего 12 страниц. Раньше можно было искать вот по этим 12 страницам. Теперь же, если попробовать поискать, например, по слову "Звенигород" будет найден 81 результат из кучи других документов фонда 520оп1. Это удобно, если пользователь именно так и хотел искать. Но я хочу искать только в одном отсканированном документе (описи) и теперь это стало не доступно.Касательно нововведений, для тех, кто пока не заметил. Задумано так: Открываем ссылку один документ (опись), там в результатах поиска прямо под поисковой строкой будет ссылка "Искать во всех описях фонда №520" (Здесь первый раз у меня браузер думал секунд 30, а потом выдал черный экран с ошибкой сайта. Ошибка именно сайта, все остальные вкладки работали без проблем. При повторном обращении к странице ошибки уже не было)... Если нажать на эту ссылку, появится ссылка "Искать во всех фондах ЦГА Москвы", если еще раз нажать на эту ссылку, то появится "Искать во всех архивах". Вот в этой иерархической цепочке не хватает начального звена "искать по одному документу/делу"
  --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (4) |
xbox Сообщений: 992 На сайте с 2020 г. Рейтинг: 1968
| Наверх ##
9 марта 2024 11:42 platonshukin Обратите внимание, по какой-то причине ряд описей распознаны с эффективностью близкой к нулю и поэтому искать по ним не получится. Вот пример: https://ya.ru/archive/catalog/...bd937703/5В примере рукописный текст не сложнее, чем в метрических книгах. Более того текст в основном не разбивается вертикальными колонками, как это бывает в метриках. Из распознанного - только штампы "ДЕЛА НЕТ" и "ХРАНИТСЯ" и те с ошибками в трех случаях из четырех. А вместо остального русского рукописного текста "распознаны" отдельные латинские буквы последовательностями от 1 до 5 букв. И даже четко написанные цифры "15." с правильно определенными границами распознаны как "6.". Одна из очевидных проблем здесь - полностью неправильная автоматическая разметка страницы. Разметка не угадала почти ни одного блока. Но это не единственная проблема. Сам текст тоже определяется неправильно. Возможна система посчитала, что это документ на латинице. А может быть причина в другом. Вероятно, что-то стоит подкрутить в алгоритмах распознавания.
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (4) |
von_nachtigallPh.D. (Chem.)  Москва => не Москва Сообщений: 1913 На сайте с 2010 г. Рейтинг: 1946 | Наверх ##
9 марта 2024 11:58 >> Ответ на сообщение пользователя xbox от 9 марта 2024 11:42 Так и латиница не распознается в принципе - хотя лютеранские метрики там есть --- Ik bun Normalis Archivaris
En ik beitel kronieken in een rots...
Ich fahre hier,
Ich fahre her
Ich habe keine Heimat mehr
R-M198, U7a (FTDNA); R-Z92, U7 (23&Me) | | |
Kapibara2022Участник  Сообщений: 59 На сайте с 2022 г. Рейтинг: 123 | Наверх ##
9 марта 2024 19:19 Почитала споры на нескольких последних страницах. И немного понять не могу: а что плохого в том что архивы не хотят давать сторонней организации (яндексу) свои ресурсы,то на чём строится ихняя деятельность? Что в этом такого ужасного то? Там работают люди,они получают зарплату... Не удивительно что архивы как организации хотят иметь какой-никакой доход со своей деятельности. Им ведь нужно и какойто плюс-минус текущий ремонт делать,чтоб штукатурка на голову не падала, и иногда чинить/покупать технику... Почему за многие другие сервисы люди готовы платить а за пользование архивом это прям фуууу, дайте нам ВСЁ и бесплатно? Даже за дурацкие подписки вроде кинопоиска и Ivi какогонибудь люди готовы платить деньги,за яндекс-муыку ту же. Хотя всё это давно и бесплатно можно скачать на торрентах. Но люди покупают подписки.... А тут не хотят?
И второй вопрос: а почему плохо когда каждая организация стремится сделать свой собственный сервис,систему,для работы какой либо? Тут приводили пример про движение автобусов. Что мол не давали яндексу эти сведения. Простите,а почему это должны давать? Почему перевозчик не имеет права сделать своё приложение или сайт или что угодно,со своими автобусами,почему он должен яндексу то всё подарить?
Может быть я не в теме конечно. Я не пользуюсь этими приложениями для автобусов,а АИСом пользовалась только один раз,и не нашла нужного. Но это лично я искать не умею. Просто меня всегда удивляет когда хотят всё унифицировать. Пусть будет у нас везде один яндекс и сбер. Везде и всюду. Всё только ихнее,все сервисы от них. Ничего оригинального,свооего нам не надо. А потом они объеденятся в сберояндекс и наступить всеобщее счастье. | | Лайк (2) |
7_kolen_predkov ДиВанное заМКАДье Сообщений: 1082 На сайте с 2021 г. Рейтинг: 3497
| Наверх ##
9 марта 2024 19:25 Kapibara2022 Потому что архивы БЮДЖЕТНЫЕ организации и все средства получают на цели, заявленные в их документации. И никаких "своих ресурсов" у них нет по определению - все документы принадлежат государству. | | Лайк (16) |
Asmodeika Сообщений: 2511 На сайте с 2010 г. Рейтинг: 1479 | Наверх ##
9 марта 2024 19:29 Так и хочется влепить минус по самое не могу...
--- Анна Иванова врач на Сахалине в 1930е гг.
Иванова Варвара Евангеловна 1929 гр. г. Екатеринбург.
Нина Николаевна Иванова 1925 гр.Чита, мать Наталья Иннокентьевна
Галина и Раиса Ененко Абран г. Казань.
| | Лайк (9) |
|