Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
Часть сообщений этой темы была выделена в тему "Копирование архивных документов мормонами" (1 марта 2024 20:43)
|
Аталина Пушкино, Московская обл. Сообщений: 1406 На сайте с 2007 г. Рейтинг: 1538
| Наверх ##
1 марта 2024 20:46 anto написал: [q] Еще одно разъяснение Росархива, почему перестали работать с яндексом https://vk.com/wall-153082959_26128
[/q]
где-то у меня ответ от Росархива валялся с таким же ответом об отсуствии законодательной базы. лет пять прошло, а воз и ныне там. ---
| | |
idylle Санкт-Петербург Сообщений: 3196 На сайте с 2017 г. Рейтинг: 2243 | Наверх ##
1 марта 2024 20:52 Аталина написал: [q] где-то у меня ответ от Росархива валялся с таким же ответом об отсуствии законодательной базы. лет пять прошло, а воз и ныне там. [/q]
Ну правильно. Потому что кто-то же должен инициировать создание этой самой законодательной базы. А кому это нужно? Росархиву это не нужно, да и никому другому, кроме граждан. Ну а мнение граждан, сами понимаете, никого особо не волнует. | | Лайк (1) |
oztech Санкт-Петербург Сообщений: 645 На сайте с 2005 г. Рейтинг: 414
| Наверх ##
1 марта 2024 23:59 anto написал: [q] Еще одно разъяснение Росархива, почему перестали работать с яндексом[/q]
Там в письме есть такая фраза: Взаимодействие РГАДА с компанией "Яндекс" осуществлялось на основании договора, заключенного в качестве эксперимента, и прекращено по истечению срок его действия и неудовлетворительных с точки зрения профессиональных архивистов результатов. Чего же ждали профессионалы от договора с ЯА? Что именно их не удовлетворило? А до ЯА эти профессионалы донесли свои претензии? Тогда, может, platonshukin поделится явно несекретным инсайдом? --- С уважением,
Григорий Шпекторов | | |
Аталина Пушкино, Московская обл. Сообщений: 1406 На сайте с 2007 г. Рейтинг: 1538
| Наверх ##
2 марта 2024 10:29 oztech написал: [q] anto написал:
[q] Еще одно разъяснение Росархива, почему перестали работать с яндексом
[/q]
Там в письме есть такая фраза: Взаимодействие РГАДА с компанией "Яндекс" осуществлялось на основании договора, заключенного в качестве эксперимента, и прекращено по истечению срок его действия и неудовлетворительных с точки зрения профессиональных архивистов результатов. Чего же ждали профессионалы от договора с ЯА? Что именно их не удовлетворило? А до ЯА эти профессионалы донесли свои претензии? Тогда, может, platonshukin поделится явно несекретным инсайдом?
[/q]
По логике, чтобы заявлять о неудовлетворительном поиске, нужно провести эксперимент: взять 2 двух человек, одному просматривать дела полистно, другому искать Яндекс поиском, сравнить результат. ---
| | Лайк (1) |
anto Сообщений: 5793 На сайте с 2009 г. Рейтинг: 4450
| Наверх ##
2 марта 2024 13:23 Еще вот - https://vk.com/arhizorro?w=wall-211758731_8699Видеозапись расширенного заседания коллегии Федерального архивного агентства 28 февраля 2024 г. С 41 минуты - Про Яндекс, позиция Росархива. oztech написал: [q] Чего же ждали профессионалы от договора с ЯА? Что именно их не удовлетворило? [/q] https://forum.vgd.ru/post/5/140482/p4826283.htm#pp4826283Это было в январском заявлении - "Качество распознавания описей не позволяет использовать данный продукт без обращения к оригиналу описи, поэтому его нельзя признать удовлетворительным (при анализе методом шинглов доля распознавания составила 44,8% для машинопечатных описей и 25,6% для всех типов рукописных описей)." | | Лайк (2) |
von_nachtigallPh.D. (Chem.)  Москва => не Москва Сообщений: 1917 На сайте с 2010 г. Рейтинг: 1954 | Наверх ##
2 марта 2024 16:20 Задам и я вопрос по качеству распознавания, но отдельных специфических документов.
Почему метрики лютеранских приходов Москвы, которые до 1890х велись на немецком языке (например, ф. 1476,оп.2) распознаны моделью... для русского языка? Это же не имеет никакого смысла! --- Ik bun Normalis Archivaris
En ik beitel kronieken in een rots...
Ich fahre hier,
Ich fahre her
Ich habe keine Heimat mehr
R-M198, U7a (FTDNA); R-Z92, U7 (23&Me) | | Лайк (3) |
oztech Санкт-Петербург Сообщений: 645 На сайте с 2005 г. Рейтинг: 414
| Наверх ##
2 марта 2024 21:48 anto написал: [q] (при анализе методом шинглов доля распознавания составила 44,8% для машинопечатных описей и 25,6% для всех типов рукописных описей).[/q]
Ага, т.е. все-таки существуют методы оценки качества распознавания. Я, помню, об этом тут спросил, так чуть глаз не выклевали. Удивительно, конечно, что только половину машинописных текстов удается распознать по принятой ЯА методике. Но это же, наверное, не тупик, есть куда двигаться. Про распознание на четверть скорописи и говорить не приходится. Остается ждать новостей с этого фронта, тогда, наверное, и описи РГАДА вернутся в поиск на ЯА. --- С уважением,
Григорий Шпекторов | | |
Михаха Сообщений: 4145 На сайте с 2008 г. Рейтинг: 3861 | Наверх ##
2 марта 2024 22:23 oztech написал: [q] Удивительно, конечно, что только половину машинописных текстов удается распознать по принятой ЯА методике.[/q]
Ничего удивительного. Лет тридцать в рамках коммерческих программных продуктов существуют алгоритмы распознавания машинописного текста. Разработана и теория и практика. Использование одного универсального алгоритма для работы с рукописными и печатными источниками, как вероятно реализовано в ЯА, непрактично. Если выбрать критерием точность распознавания. Не собирался больше писать в данной теме и критиковать хорошее дело. Но, размещение в проекте ЕВ и газет не оставляет шансов. | | Лайк (1) |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
3 марта 2024 9:57 oztech написал: [q] Чего же ждали профессионалы от договора с ЯА? Что именно их не удовлетворило? А до ЯА эти профессионалы донесли свои претензии? Тогда, может, platonshukin поделится явно несекретным инсайдом?
[/q]
Кажется, инсайд по определению должен быть секретным, иначе это не инсайд  Какие на самом деле ожидания были у РГАДА от сотрудничества с Яндексом, вероятно, знают только в архиве; по крайней мере, насколько мне известно, никакие явно указанные в договоре обязательства нарушены не были. В качестве частного мнения (на основе https://archives.gov.ru/press/...ex.shtml), могу предположить: ожидалось, что в течение срока действия (до конца 2023 года) мы распознаем и передадим в архив описи в виде, пригодном "для заказа архивных дел читателями на сайте архива". То есть, с близким к 100% качеством распознавания и с сохранением структуры таблиц. В общем, аккуратненькую эксельку, готовую для загрузки в какую-нибудь АИС. Пока таким требованиям качества наше распознавание не соответствует. Но, рискну предположить, оно тем не менее приносит пользу обычным людям. Тут каждый архив решает сам, что важнее. | | Лайк (19) |
|