Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
balt-amber Сообщений: 847 На сайте с 2011 г. Рейтинг: 449
| Наверх ##
14 февраля 2023 14:26 14 февраля 2023 14:28 jrw, напрасно Вы удалили свой пост. По моему разумное предложение завести тему в которой форумчане высказывали бы свои предложения по проекту, а руководитель проекта Яндекс Архивы был бы модератором. --- Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда | | Лайк (1) |
gbyudby Москва Сообщений: 1631 На сайте с 2020 г. Рейтинг: 883 | Наверх ##
14 февраля 2023 15:16 14 февраля 2023 15:17 о конкретике то о чем советовал madrih - присмотреться что пишет яндекс в расшифровке интересный глюк получается с переносом фамилии перенос фамилии часто встречается в РС вот например страница РС https://yandex.ru/archive/cata...749503/452№ 358 фамилия Трусов - вообще не распознается № 360 фамилия Окользин - индексируется частично, "околь" что любопытно - если в поиске ввести "околь" - в результатах эта с.452 появляется вывод (на мой взгляд) - проводить поиск с "расчленением" фамилии )) | | Лайк (4) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2485 | Наверх ##
14 февраля 2023 17:27 xbox написал: [q] И вот специалист читает последние несколько страниц, видит в основном тексты ни о чем, споры, оскорбления, бесконечные повторения и решает, что чтение темы будет неэффективной тратой времени.[/q]
Лично я никого не оскорбляла (надеюсь). Это были просто мои размышления (дилетанта) на тему машинной расшифровки рукописного документа. Плюс сравнение с другим ресурсом (как это сделано у других). Надеюсь, что этим никого не обидела. А тема искусственного интеллекта для меня в любом случае интересна. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (1) |
Nadin2012 Москва Сообщений: 268 На сайте с 2012 г. Рейтинг: 194
| Наверх ##
15 февраля 2023 11:23 Хорошо. что здесь написали про удвоенные страницы. Наткнулась сейчас на дело 203-745--318, поделила номер указанной страницы пополам и увидела искомую запись на сайте ЦГАМ. | | |
xbox Сообщений: 978 На сайте с 2020 г. Рейтинг: 1929
| Наверх ##
15 февраля 2023 13:22 Рассказываю свое предположение, как можно сообщить Яндексу о проблемах на их сайте.Вот здесь указан почтовый адрес для обратной связи: https://ya.ru/archive/feedbackЯ пробовал писать на него с некоторыми предложениями сразу после того, как о проекте стали писать на форуме, и пробовал писать недавно об ошибке. В первом случае я не получил ответа, а во втором получил сначала автоматический ответ от робота с номером тикета, а затем через несколько часов еще одно сообщение "Спасибо, что обратили наше внимание на эту ситуацию. Она передана специалистам сервиса для проверки." Исправят или нет ошибку, будет понятно позже. Но очевидно, что кто-то должен был хотя бы прочитать текст. Почему не ответили на первое самое первое письмо, я не знаю. Возможно тогда еще что-то не было настроено в службе поддержки. Я думаю, что в Яндексе обработка писем может работать примерно так: На почтовый адрес ежедневно приходит сотни или тысячи писем, включая спам. Дальше их должен обработать робот, спам отсеить, а оставшиеся письма разложить по категориям (ошибка, предложение, благодарность итп). Во-первых, такие алгоритмы не всегда правильно разбирают смысл сообщения, во-вторых часть неприоритетных сообщений может лежать не просмотренными годами. Кто пробовал пробиться через авто-информатор в банке или через чат-бот банка, тот может понять, как примерно происходит фильтрация. 90% обращений хотят закончить без передачи оператору. Поэтому, если Вы обнаружили ошибку, то попробуйте составить сообщение так, чтобы робот точно классифицировал ваше сообщение. Ошибка - это обычно приоритетная задача в отличии от пожеланий на несколько страниц.В заголовке письма пишете примерно следующее "Ошибка отображения/обработки/распознавания (итп) на сайте Яндекс.Архивы" В самом письме коротко, но конкретно описываете проблему с указанием ссылок, где возникает ошибка. Подписываетесь. После этого отправляете письмо и ждете номер тикета. Попробуйте, а потом поделитесь, сработал ли такой способ обращения. Например, если нашли дела с задвоенным количеством сканов, то это хороший повод сообщить об ошибке в Яндекс. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (9) |
jrw Сообщений: 5690 На сайте с 2021 г. Рейтинг: 6130
| Наверх ##
15 февраля 2023 13:30 15 февраля 2023 13:37 xbox написал: [q] Рассказываю свое предположение, как можно сообщить Яндексу о проблемах на их сайте.
[/q]
И это при том, что Вы знаете, что руководитель проекта Яндекс-Архив зарегистрирован на этом форуме и постоянно его посещает ? Он даже лайкнул Ваш профиль. По моему мнению, Вы являетесь аффилированным лицом Яндекс - Архива, судя по вашим сообщениям в этой теме. xbox Искренне желаю удачи Вам в вашем совместном проекте с Яндексом ! | | |
xbox Сообщений: 978 На сайте с 2020 г. Рейтинг: 1929
| Наверх ##
15 февраля 2023 13:42 jrw написал: [q] И это при том, что Вы знаете, что руководитель проекта Яндекс-Архив зарегистрирован на этом форуме и постоянно его посещает ? Он даже лайкнул Ваш профиль. По моему мнению, Вы являетесь аффилированным лицом Яндекс - Архива, судя по вашим сообщениям в этой теме.[/q]
Я к Яндексу, к сожалению, отношения не имею. Также я не имею отношения ни к одному из архивов. Отношение имею к здравому смыслу. А Вам предлагаю писать по делу. --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (7) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2485 | Наверх ##
15 февраля 2023 17:22 jrw написал: [q] руководитель проекта Яндекс-Архив зарегистрирован на этом форуме и постоянно его посещает ?[/q]
Если это так, то почему он не принимает участие в дискуссии? Ведь интересно было бы пообщаться, тем более, что тема общая для всех, всем интересна. Присоединитесь к нам, пожалуйста! --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (2) |
madrih СПб, Пушкин Сообщений: 942 На сайте с 2011 г. Рейтинг: 1151 | Наверх ##
15 февраля 2023 23:08 microArt написал: [q] Если это так, то почему он не принимает участие в дискуссии? Ведь интересно было бы пообщаться, тем более, что тема общая для всех, всем интересна. Присоединитесь к нам, пожалуйста! [/q]
Ну вот вы опять не понимаете, что для сотрудников Яндекса - этот проект, это их работа. Для вас это "интересно", т.к. является личным хобби и образом жизни, на которое вы с удовольствием тратите свое личное свободное время, а для них это задача на рабочее время суток, и за это время они должны успеть сделать свою основную работу, потратив свое рабочее время таким образом, каким требуют от них их руководители, а не "шастая" по чужим форумам. И уж тем более вряд ли у них есть желание по своим рабочим вопросам заглядывать на сторонние форумы после окончания рабочего дня. Поэтому, если вы хотите, чтобы их заинтересовал наш форум (данная тема) в их рабочее время, то эта тема должна быть максимально конструктивной, с флудом сведенным не то, что к минимуму, а к нулю... Мы здесь пока таким образом, к сожалению, самоорганизоваться не можем. Поэтому и получается, что пока все так, как есть, то следует писать им через механизмы обратной связи, указанным xbox способом. --- По/аславские из Могилевской губернии | | Лайк (7) |
anto Сообщений: 5785 На сайте с 2009 г. Рейтинг: 4431
| Наверх ##
15 февраля 2023 23:26 15 февраля 2023 23:26 madrih написал: [q] Ну вот вы опять не понимаете, что для сотрудников Яндекса - этот проект, это их работа[/q]
Поэтому их начальство должно делегировать представителя яндекса для общения на форуме, как это сделал например глава архивного управления Ярославской области. И спокойно системный администратор архива отвечает на все вопросы пользователей на форуме. На какие не может - пересылает коллегам - и публикует ответ на форуме. Вот это нормальная работа. | | Лайк (6) |
|