Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
Olka69 | Наверх ##
17 января 2024 9:13 Helen V написал: [q] anto написал:
[q]
Качество распознавания описей не позволяет использовать данный продукт без обращения к оригиналу описи, поэтому его нельзя признать удовлетворительным
[/q]
У меня только один вопрос: - можно ли заказать дело в читальный зал, не выходя из дома (заполнив бланк и отправив его на мейл архива) - если не возможно заказать, то замечание о необходимости обращения к оригиналу описи для заказа дела вообще не имеет смысла;
[/q]
Дела можно заказывать удаленно --- http://forum.vgd.ru/3385/ дневник
Дурневы Новиковы Артемовы-Орел и губерния, Долгушевы- Пачелма, Осиповы из Калужской губернии, Калинины - Муром, Рощины -Меленки
| | |
solo_vv Санкт-Петербург Сообщений: 805 На сайте с 2018 г. Рейтинг: 1046 | Наверх ##
17 января 2024 10:10 anto написал: [q] В связи с повышенным интересом общественности к ситуации[/q]
Росархив необычно быстро отреагировал, выдав такой ответ. Видится, что истинные причины все таки озвучены выше, а это перевод стрелок на Яндекс, типа мы тут не при чем, это все они. Лукавство, или что-то было в договоре еще написано мелким шрифтом на основе чего Яндекс убрал эти описи, либо было еще что-то за кадром, не написанное текстом, и что мы никогда не узнаем (звонок другу и т.п.). Но в любом случае у общественности действительно повышен интерес к ситуации, platonshukin, Платон, как считаете, можно ожидать ответа от Яндекса "о причинах такого решения"? Ведь исходя из написанного выше Росархивом, это можно трактовать, как то, что описи можно и вернуть на Яндекс архив. --- Соловьевы (Тверская губ. Вышневолоцкий у. Парьевская вол.)
Федулаевы (Петроградская губ. Гдовский у. Скарятинская вол.)
Одинцовы (Тверская губ. Калязинский у. Поречская вол.)
Гранильщиковы (Московская губ. Верейский у. Смолинская вол.)
http://forum.vgd.ru/3513/ | | Лайк (12) |
E_G_K Сообщений: 106 На сайте с 2018 г. Рейтинг: 117
| Наверх ##
17 января 2024 11:37 Там же ещё какие-то дурачки — не помню из какого архива, тоже писали, что плохо всё распознаётся, поэтому мы не будем сотрудничать. Могли бы уж что-нибудь более адекватное придумать. | | Лайк (3) | Жалоба (1) |
romanvm Россия, г. Ефремов Сообщений: 5364 На сайте с 2014 г. Рейтинг: 3370 | Наверх ##
17 января 2024 12:35 Исходя из всего написанного, напрашивается вывод - сохранять при возможности сразу всё, что найдено, любыми способами на своём компьютере. Иначе можно найденное, потом больше никогда не найти | | Лайк (21) |
gbyudby Москва Сообщений: 1643 На сайте с 2020 г. Рейтинг: 889 | Наверх ##
17 января 2024 13:28 romanvm написал: [q] сохранять при возможности сразу всё, что найдено, любыми способами на своём компьютере[/q]
это точно, только в данном случае с РГАДА в яндексе не поможет - описи спокойно лежат на сайте архива, но читать их надо вручную)) | | |
xax_nv г. Нижневартовск, ХМАО - Югра Сообщений: 3215 На сайте с 2010 г. Рейтинг: 7026 | Наверх ##
17 января 2024 13:41 anto написал: [q] яндекс удалил описи РГАДА со своего сайта без согласования с Росархивом и РГАДА[/q]
Возможно, это сделано с целью прекратить критические высказывания о плохом распознавании текста и дать время на усовершенствование механизма распознавания. Но я могу и ошибаться, подождем Платона. | | Лайк (4) |
vam Москва Сообщений: 27745 На сайте с 2003 г. Рейтинг: 3628 | Наверх ##
18 января 2024 11:28 18 января 2024 11:39 anto написал: [q] Согласно данному документу РГАДА передал сканированные образы своих описей (порядка пятой их части) Яндекс. Сотрудниками Яндекса, в свою очередь, было проведено распознавание данных описей, результаты размещены на сервисе компании «Поиск по архивам».
Итоги этого распознавания были продемонстрированы на встрече в середине 2023 г. с участием представителей Федерального архивного агентства (Росархива), РГАДА и Яндекса. Основные выводы по результатам проделанной работы сводились к следующему:
Качество распознавания описей не позволяет использовать данный продукт без обращения к оригиналу описи, поэтому его нельзя признать удовлетворительным (при анализе методом шинглов доля распознавания составила 44,8% для машинопечатных описей и 25,6% для всех типов рукописных описей). Вследствие отсутствия структурирования текста невозможно его использование для заказа архивных дел читателями на сайте архива, а также в ГИС УИАД. На указанной встрече сотрудники Яндекса подтвердили, что имеющаяся технология распознавания текста находится в процессе развития и уведомили о намерении продолжать работу по ее совершенствованию.[/q] Вся прелесть поиска с помощью сервиса Яндекс-архив заключается в сравнении результатов распознавания и оригинала, а не в тупом листании описей, указателей, алфавитов и первоисточников с отрицательным результатом. Крайне узко поставлена задача, ограниченная распознаванием затертых в течение столетий описей, процент распознавания машинописного текста явно занижен. Странно называть архивными описями указатели 19 века, созданные черновым почерком для внутреннего ведомственного применения, которые без архивных переводных таблиц не содержат поисковой информации. Если бы для распознавания были предоставлены сканы фонда 350, Яндекс-архив смог бы проиндексировать миллионы географических названий и фамилий и найти без использования описей любую информацию. | | Лайк (23) |
apuzanoff Модератор раздела
Ставропольский край Сообщений: 2335 На сайте с 2017 г. Рейтинг: 1479 | Наверх ##
18 января 2024 12:36 E_G_K написал: [q] Там же ещё какие-то дурачки — не помню из какого архива, тоже писали, что плохо всё распознаётся, поэтому мы не будем сотрудничать. Могли бы уж что-нибудь более адекватное придумать.
[/q]
По крайней мере Ставропольский ГАСК именно так мотивировал своё нежелание передавать отсканированные материалы в Яндекс-Архивы: низкое качество распознавания Ну да, в читальном зале с двух компьютеров без какого-либо распознавания, с посещением читального зала только по записи с очередью на месяц - оно куда как удобней для пользователей, чем вот этот вот некачественный алгоритм от Яндекса | | Лайк (16) |
xax_nv г. Нижневартовск, ХМАО - Югра Сообщений: 3215 На сайте с 2010 г. Рейтинг: 7026 | Наверх ##
18 января 2024 13:04 apuzanoff написал: [q] Ставропольский ГАСК именно так мотивировал своё нежелание передавать отсканированные материалы в Яндекс-Архивы[/q]
А вот как их переубедить? Очень хотелось бы этого. Они ведь и сеть их не выкладывают, не то, что астраханский архив. | | |
vam Москва Сообщений: 27745 На сайте с 2003 г. Рейтинг: 3628 | Наверх ##
18 января 2024 14:36 18 января 2024 14:38 apuzanoff написал: [q] некачественный алгоритм от Яндекса[/q]
В контакте при обсуждении этой темы определились, что РГАДА хотел использовать сервис Яндекса с целью решения задачи наполнения федеральной базы данных архивных описей как бы ничего не делая. То есть, если бы Яндекс распознал 90 процентов текста - все равно задача не решилась без ручного труда - сравнения с оригиналом описи. Получается, что Архив пытался отформатировать неформатируемое - описи 19 века, не прояваляя интерес к поисковым возможностям этого сервиса, который находится в процессе развития и совершенствования. | | Лайк (6) |
|