Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
3 февраля 2023 16:28 3 февраля 2023 16:32 Кто писал в техподдержку Яндекса (на адрес электронной почты), скажите, получил кто-нибудь ответ? Там отвечают или нет?
А так-то у них даже роботы вежливые. Спросила у них по другому вопросу (про свои файлы на яндекс-диске, которые давно не оплачены), ответили...
Пишет вам робот Яндекс Диска. Я получил ваше обращение и дал ему номер... ........ Если эта информация оказалась полезной для вас, пожалуйста, оцените мою работу Это очень порадует меня и моих создателей! --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (1) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
3 февраля 2023 16:41 jrw написал: [q] Стоковые фото американцев.[/q]
С чего Вы взяли, что это именно американцы? Может, и стоковые фото, но русских... --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (1) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
3 февраля 2023 17:08 3 февраля 2023 17:12 jrw Ничего себе. Спасибо. Это даже очень интересно...
Обратная связь очень даже нужна, тут никакого другого мнения нет. Хотя бы для исправления найденных ошибок (то, что они будут - это несомненно). --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (1) |
solo_vv Санкт-Петербург Сообщений: 805 На сайте с 2018 г. Рейтинг: 1046 | Наверх ##
3 февраля 2023 18:01 microArt написал: [q] Кто писал в техподдержку Яндекса (на адрес электронной почты), скажите, получил кто-нибудь ответ? Там отвечают или нет?[/q]
Да, отвечают. Писал на archive-search-support@yandex-team.ru 31.01. ответил сотрудник поддержи на следующий день. --- Соловьевы (Тверская губ. Вышневолоцкий у. Парьевская вол.)
Федулаевы (Петроградская губ. Гдовский у. Скарятинская вол.)
Одинцовы (Тверская губ. Калязинский у. Поречская вол.)
Гранильщиковы (Московская губ. Верейский у. Смолинская вол.)
http://forum.vgd.ru/3513/ | | Лайк (1) |
LeTom Москва Сообщений: 1290 На сайте с 2012 г. Рейтинг: 9378 | Наверх ##
3 февраля 2023 20:12 --- Ищу потомков: Фролова Федора Петровича 1893 г.р.,Фролова Василия Петровича, Карпухина/Карпина Осипа (Иосифа) Степановича, Панферовых/Парфеновых Московская губ., Подольский уезд.
**************************
Исполняю заказы по расшифровке рукописных текстов 18-19 вв.
| | Лайк (2) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
3 февраля 2023 20:44 LeTom написал: [q] Вот тут, кстати, дан ответ касательно исправления ошибок. https://habr.com/ru/company/ya...t_25183928
[/q]
Спасибо. А можно, я тут продублирую тот ответ? Попробую ответить, так как много вопросов про это задается, о способах "поправить" расшифровку нейросетки. Мы думали над вики-моделью, когда каждый может править, а дальше есть модераторы. В наших оценках это оказывалось слишком "дорого" по разным параметрам. Нужна защита от бесконечного потока малополезных правок. Идеальный вариант, когда человек если взялся - приводит в идеальный вид весь документ (скан). Мы рассматриваем варианты, как можно было бы дать энтузиастам, тем кто готов помочь сделать расшифровки "идеальными", доступ на редактирование. Когда тут решение будет принято, то на странице сервиса появится соответствующий раздел, чтобы оформить такое взаимодействие. При этот такой расшифровщик должен будет принять правила работы, чтобы формальные критерии соблюдались и человек осознавал свою роль в проекте и ответственность за проделанную работу. Так что следите за новостями, надеюсь скоро мы сможем порадовать всех новостями.Дискуссия там интересная. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (7) |
KoLenka Питерская я Сообщений: 2350 На сайте с 2021 г. Рейтинг: 12916 | Наверх ##
3 февраля 2023 20:48 LeTom написал: [q] Вот тут, кстати, дан ответ касательно исправления ошибок. https://habr.com/ru/company/ya...t_25183928[/q]
Судя по никам, вопросы там задают, как раз наши ВГД-шники - программисты. А значит, вопросы правильные, совсем не дилетантские. | | Лайк (2) |
LesebuecherУчастник  Москва Сообщений: 72 На сайте с 2021 г. Рейтинг: 81 | Наверх ##
3 февраля 2023 20:57 okolobaxa написал: [q] Эм, я не указал, что работает только для страницы с одним сканом, не для массового скачивания. Для массового скачивания с самого сайта ЦГА Москвы используйте вот это инструмент, написанный мной ранее https://github.com/okolobaxa/cgamos-downloader[/q]
С Вашего позволения добавлю для таких одарённых, как я  Чтобы попасть в нужное меню в последней версии Yandex Browser (да и вообще во всех Chrome' анутых браузерах), где присутствуют все волшебные кнопки "режим разработчика" и "загрузить распакованный плагин", надо в рабочей строке браузера вбить: browser://extensions/ И всё получится. Как только нашли нужную страницу, увеличили, посмотрели, убедились - нужный фрагмент - обновите страницу, чтобы она была в изначальных параметрах. А дальше качайте по инструкции к плагину. Огромная благодарность автору за идею и реализацию! | | Лайк (1) |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
3 февраля 2023 22:19 Количество дел ЦГА Москвы в каталоге Яндекса увеличилось. Сейчас у них отмечено "Оцифровано дел 7386", А еще вчера (или пару дней назад) было 7155. Лед тронулся. Надеюсь и остальные уже оцифрованные 3 с лишним тысячи дел из ЦГАМ загрузят.
Несколько тысяч дел Оренбургского архива Яндекс загрузил за неделю. Поэтому, если решение о добавлении по ЦГАМ принято, все может произойти в короткий срок.
Я вот даже подумываю пока отложить просмотр, чтобы два подхода не делать. А то просмотришь результаты по 7тыс дел, а потом при просмотре результатов из 10 тыс дел, две трети могут быть "старыми". А на определение того, смотрел уже файл или нет, тоже время требуется. Не все же старые находки в голове удержишь. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (10) |
xbox Сообщений: 986 На сайте с 2020 г. Рейтинг: 1957
| Наверх ##
3 февраля 2023 23:00 С учетом того, что количество дел изменилось, решил некоторый цифры сравнить.
Обратил внимание, что в каталоге Яндекса в фонде 592 числится всего 49 дел, в то время, как на сайте ЦГА Москвы выложено 47дел.
Сравнил количество дел по описям. Фонд 592, опись 1 - у Яндекса числится 15 дел, на сайта ЦГАМ - 13 дел. Фонд 592, опись 2 - у Яндекса числится 34 дел, на сайта ЦГАМ столько же.
С учетом того, что Яндекс может получать дела напрямую от архива и уже были отмечены случаи, когда у Яндекса были выложены дела, которые ЦГАМ у себя не выкладывал, сверил все по номерам дел.
Оказалось, что хоть у Яндекса и числится 15 дел в первой описи, реально обложки и заголовки выложены по 13 делам. Т.е. "новых" дел нет. И тогда остаются две версии. Либо Яндекс не умеет считать, либо он отобразил реальное количество дел, которые у него уже есть, а два "недостающих в каталоге дела" должны появиться в ближайшее время после распознавания текста. Посмотрим, чем дело закончится.
  --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (4) |
|