Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
xbox Сообщений: 985 На сайте с 2020 г. Рейтинг: 1954
| Наверх ##
2 июня 2023 20:26 jrw написал: [q] LeTom написал:[q] Многие затаили дыхание...)[/q] Пока ответа нет...[/q]
Какой смысл подобных писем в службу поддержки? Примерно три дня назад появился раздел РГАДА. Сегодня в этом разделе появился Фонд 350. И сразу кто-то из поддержки должен отвлечься и рассказать в персональном письме подробнее. Может быть стоит подождать хотя бы пару недель и все и так будет видно? Чем больше таких писем в поддержку любой компании, тем меньше вероятность, что поддержка вообще будет на что-то реагировать, даже на сообщения об ошибках на сайте. Собственно от Яндекса в части их проекта с Архивами пока только автоматические отписки и приходят. LeTom написал: [q] corian55 написал:[q] Я лично нет. Предпочитаю читать оригальные документы, а не чьи-либо оцифровки[/q] В оригинале, конечно, еще интереснее, но не у всех есть такая возможность. Учитывая, просторы нашей Родины.[/q]
А что РГАДА выдает оригиналы, например, ревизских сказок на руки при наличии оцифрованных копий? Так, если 10-20 человек полистают книжечку, которой 400 лет, после её можно в реставрацию отправлять. Но это не проблема, обычно в архивах книги из очереди на реставрацию быстро возвращаются. Через десять лет вернется в читальный зал, ну в крайнем случае, через двадцать. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (8) |
LeTom Москва Сообщений: 1290 На сайте с 2012 г. Рейтинг: 9372 | Наверх ##
2 июня 2023 20:48 xbox Мне показалось речь идет, вообще, об оригиналах документов, не только о РГАДА, ф. 350. --- Ищу потомков: Фролова Федора Петровича 1893 г.р.,Фролова Василия Петровича, Карпухина/Карпина Осипа (Иосифа) Степановича, Панферовых/Парфеновых Московская губ., Подольский уезд.
**************************
Исполняю заказы по расшифровке рукописных текстов 18-19 вв.
| | |
corian55 Екатеринбург Сообщений: 4134 На сайте с 2012 г. Рейтинг: 10933 | Наверх ##
2 июня 2023 20:52 jrw написал: [q] corian55 написал:
[q] а не чьи-либо оцифровки :-)
[/q]
Не согласен с Вами, оцифровку можно увеличить, а оригинальный документ только через лупу надо разбирать. [/q]
Вот как раз сейчас работаю с оригинальным документом (850 л.) Уж кто только его не использовал и частично не публиковал: признанные филологи, именитые историки, и у всех в прочтении встречаю ошибки, иной раз существенные ((( Вот потому предпочитаю читать оригиналы. :-) --- НЕ ЛЮБЛЮ АНОНИМОВ со школьных лет. У вас ко мне вопрос? Представьтесь!
Правильно изначально сформулированный вопрос - это уже половина ответа на него. | | |
xbox Сообщений: 985 На сайте с 2020 г. Рейтинг: 1954
| Наверх ##
2 июня 2023 21:24 jrw написал: [q] xbox написал:[q] Сегодня в этом разделе появился Фонд 350[/q] Вы ошибаетесь, он уже пропал.[/q]
Если следовать этой логике, то, если человек умер, то он и не рождался. Все эти отслеживания для нетерпеливых. Я думаю, прямо сейчас раздел правят. Он может появляться и пропадать хоть каждый час. Дней десять пройдет, и все будет понятно. Фонд 350 скрыли. Но в фильтре РГАДА он есть. В фильтре РГАДА всего два фонда №236 и №350. Вероятно в этих двух фондах можно ожидать первые реальные дела из РГАДА.
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (6) |
xbox Сообщений: 985 На сайте с 2020 г. Рейтинг: 1954
| Наверх ##
2 июня 2023 21:52 corian55 написал: [q] jrw написал:[q] Не согласен с Вами, оцифровку можно увеличить, а оригинальный документ только через лупу надо разбирать.[/q] Вот как раз сейчас работаю с оригинальным документом (850 л.) Уж кто только его не использовал и частично не публиковал: признанные филологи, именитые историки, и у всех в прочтении встречаю ошибки, иной раз существенные ((( Вот потому предпочитаю читать оригиналы.:-)[/q]
По-моему, Вы смешиваете понятия. Оригинал, нормально оцифрованный оригинал, чужие посредственные снимки оригинала или пересъемка с экрана и чье-то прочтение/расшифровка. Про чье-то прочтение (расшифровку) все понятно. Ошибок может быть миллион и никто без оригинала про них не узнает. Вы считаете, что у других исследователей ошибки. Следующий исследователь может тоже самое про Ваше трактование сказать... Хорошо оцифрованный на профессиональном оборудовании оригинал ничем не хуже источника на бумаге (в хорошем разрешении, без сильного сжатия итп). Часто оцифрованный оригинал значительно лучше. Не могу похвастаться большим опытом работы с оригиналами на бумаге, но несколько дел по 1тыс страниц, я смотрел в читальном зале. Так вот это было больше на муку похоже. Почерк такой мелкий, чернила на половину выцвели, разворот книги всегда приходится поддерживать одной рукой и при этом делать выписки на листочек. Ну или можно при наличии договора с архивом сфотографировать некоторые страницы на свой телефон или непрофессиональный фотоаппарат при посредственном освещении. И чем это лучше? Почти целый день уходит на одну метрическую книгу. А главное, после этого остаются записи с ошибками, которые не перепроверишь, или посредственная копия маленькой части дела. Через год после того, как я ознакомился с оригиналом на бумаге, дело оцифровали и выложили в открытый доступ. Это небо и земля. В оцифрованном документе все отлично видно. Любую часть можно приблизить хоть на весь экран. Нужные страницы можно сохранить. Если в чем-то есть сомнения можно в любой момент перепроверить и свои прочтения и записи и чужие. Можно переслать файлы другому пользователю итп. У оригиналов на бумаге есть конечно другое преимущество. Кроме текста бумага пропитана временем и историей. Но Вы же не про это писали, а про техническую сторону работы с документами. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (15) |
jrw Сообщений: 5688 На сайте с 2021 г. Рейтинг: 6136
| Наверх ##
3 июня 2023 14:08 7 июня 2023 15:34 xbox написал: [q] Примерно три дня назад появился раздел РГАДА. Сегодня в этом разделе появился Фонд 350. И сразу кто-то из поддержки должен отвлечься и рассказать в персональном письме подробнее.[/q]
xbox написал: [q] В фильтре РГАДА всего два фонда №236 и №350. Вероятно в этих двух фондах можно ожидать первые реальные дела из РГАДА.
[/q]
 | | Лайк (4) |
xbox Сообщений: 985 На сайте с 2020 г. Рейтинг: 1954
| Наверх ##
3 июня 2023 14:58 3 июня 2023 23:59 Фонд 350 РГАДА скрыт, дела в нем не отображаются, но чтобы подтвердить, что дела там есть и они распознаются, зайдем через "задний проход". Вчера я на форуме показывал, что в фильтре поиска по РГАДА есть всего два фонда №236 и №350. Попробуем воспользоваться этим поиском. В фильтре выбираем Архив=РГАДА, Фонд=350, ставим галочку "Оцифрованные документы", в тексте пишем любое распространенное слово и смотрим, что получилось. Запрос "село" - нашелся 21 результат Запрос "деревня" - нашлось 22 результата Запрос "крестьянин" - нашлось 144 результата https://ya.ru/archive/search?t...igitized=0 - Пример поиска "крестьянин" Сам найденный текст не отображается. Номера дел не отображаются. Но количество результатов есть. Этот текст может быть всего лишь из распознанной описи, а не текстом из более ценного документа, но слишком много подозрительных моментов:Если передали описи, почему по фондам в количестве 272фонда они есть, а по фонду №350 из нет? Почему количество оцифрованных дел в РГАДА равно 708? Описи за оцифрованные дела не считаются. Посмотрите в Мордовском архиве пример. Да и раньше в статистике РГАД было 89тыс документов, но ноль оцифрованных дел. Что это за оцифрованные дела появились? Почему все "оцифрованные дела" в размере "100%" относятся к категории "метрические книги"? Всякие "левые" типы документов к метрическим книгам не прицепляют обычно. Почему в поисковом фильтре только два фонда, включая фонд №350? Вполне вероятно, что по материалам РГАДА идет тестирование, адаптация к сайту Яндекса итп. Например, сам текст документов 17века распознать сложнее, чем текст 18-20веков, отличается и почерк, и стиль, и речь и тп. Поэтому, как минимум, может требоваться изменение алгоритмов распознавания.. Поэтому, я считаю, что Яндекс с большой вероятностью ответил так, чтобы от него отстали и не предъявляли раньше времени завышенных требований. Если ничего не обещать, то можно месяцами спокойно работать, а любое обновление будет расцениваться, как подарок пользователям. А если пообещать что-то, то уже, начиная со следующего дня это припомнят и будут обсуждать, какие в Яндексе тормоза и бездельники... Яндекс.Архивы заранее обычно не сообщают о планах. Почти всё узнаем по факту. А ответ РГАДА не передал " на данный момент" подразумевает, что в любой следующий момент могут передать что-то большее. Использованный прием с "задним проходом", - это вероятно программная ошибка. Если Яндекс пишет, что нашлось 122 результата, то покажите их. А, если не можете показать, то и не надо их считать. В данном примере сразу очевидно, что результаты скрыты. А в другой раз может быть написано, что найдено 5тыс результатов и выведено пара страниц со списком дел... Ошибку, вероятно, могут профиксить, поэтому для истории прикладываю скриншот. "Видишь суслика? А он есть", ©ДМБ
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (8) |
reavers Москва Сообщений: 554 На сайте с 2009 г. Рейтинг: 351 | Наверх ##
3 июня 2023 23:14 xbox написал: [q] В фильтре РГАДА всего два фонда №236 и №350.[/q]
Появились и другие фонды, например 1239 --- Москва - Купцы:
Мусорины (Кожевницкая слобода);
Ефимовы (Дмитровская слобода) с 1796 г., до д. Кривошеино Калужского у.
Лазаревы (Напрудная сл.) с 1845г., до д. Алексеевское (приход с. Гуслицы)
Тамбовская губ.:
с. Верхнеспасское - Носковы, Хулины; с. Старосеславино - Гусев, Завражной | | Лайк (1) |
xbox Сообщений: 985 На сайте с 2020 г. Рейтинг: 1954
| Наверх ##
3 июня 2023 23:36 reavers написал: [q] xbox написал:[q] В фильтре РГАДА всего два фонда №236 и №350.[/q] Появились и другие фонды, например 1239[/q]
Прямо сейчас проверил. В фильтре поисковой формы, если выбрать РГАДА, то как было, так и есть всего два фонда. Фонд1239 вместе с кучей других фондов РГАДА есть просто в разделе с самим архивом, но в поисковом фильтре у меня его нет. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | |
reavers Москва Сообщений: 554 На сайте с 2009 г. Рейтинг: 351 | Наверх ##
3 июня 2023 23:59 xbox написал: [q] Прямо сейчас проверил. В фильтре поисковой формы, если выбрать РГАДА, то как было, так и есть всего два фонда.
Фонд1239 вместе с кучей других фондов РГАДА есть просто в разделе с самим архивом, но в поисковом фильтре у меня его нет.[/q]
Вы правы, в фильтре всего 2 фонда. Но дела по поиску просто РГАДА без указания фонда находятся и в других фондах. --- Москва - Купцы:
Мусорины (Кожевницкая слобода);
Ефимовы (Дмитровская слобода) с 1796 г., до д. Кривошеино Калужского у.
Лазаревы (Напрудная сл.) с 1845г., до д. Алексеевское (приход с. Гуслицы)
Тамбовская губ.:
с. Верхнеспасское - Носковы, Хулины; с. Старосеславино - Гусев, Завражной | | |
|