Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
osokina-galina Братск, Иркутская область Сообщений: 2570 На сайте с 2016 г. Рейтинг: 5551 | Наверх ##
16 февраля 2023 9:28 osokina-galina
Штопор, наверное, это ник мужчины? Уточните, пожалуйста!!! --- На фото мой дед Нечаев Георгий Кузьмич, 1900 г. р.
Ищу : место рождения, пращура Ондрюшко Нечаев, упомянут в 1696 г. рядовой казак.
В будущее мы входим, оглядываясь на прошлое.
(Поль Валери) | | |
Михаха Сообщений: 4136 На сайте с 2008 г. Рейтинг: 3841 | Наверх ##
16 февраля 2023 9:37 | | |
osokina-galina Братск, Иркутская область Сообщений: 2570 На сайте с 2016 г. Рейтинг: 5551 | Наверх ##
16 февраля 2023 9:43 Михаха
Вот спасибо, буду знать!!!
С уважением Галина. --- На фото мой дед Нечаев Георгий Кузьмич, 1900 г. р.
Ищу : место рождения, пращура Ондрюшко Нечаев, упомянут в 1696 г. рядовой казак.
В будущее мы входим, оглядываясь на прошлое.
(Поль Валери) | | |
jrw Сообщений: 5688 На сайте с 2021 г. Рейтинг: 6136
| Наверх ##
16 февраля 2023 10:49 16 февраля 2023 11:15 Ekaterinburg написал: [q] Я бы не сказала что Тимур читает лучше, чем jrw.[/q]
Вы ошибаетесь. Лучшие это Timas, Nettuno, Fert, Znoelena и NadejdaOrel. Nettuno вообще безошибочно все читает и исправляет ошибки ! Мне непонятно почему у нее еще нет медали? Я предлагаю мою медаль отдать Nettuno. | | Лайк (2) |
poisktob Сообщений: 573 На сайте с 2016 г. Рейтинг: 306
| Наверх ##
16 февраля 2023 12:03 Ekaterinburg написал: [q] Вот тут Штопор, пожалуй, не один из..., а лучший ---[/q]
Присоединяюсь. --- тоб | | Лайк (3) |
balt-amber Сообщений: 850 На сайте с 2011 г. Рейтинг: 452
| Наверх ##
16 февраля 2023 12:09 Мне здорово помогла в прочтении текста elena_krd. Заметила то, что другие не увидели, считаю ее тоже высококвалифицированным специалистом. Правда, обращался за помощью уже давно. --- Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда | | Лайк (1) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
16 февраля 2023 12:23 Лично я хотела узнать у представителя Яндекса о том: - какие перспективы у вашего проекта? Есть ли сведения, что и другие архивы присоединятся к проекту? Какие требования выдвигают архивы (чтобы присоединиться к проекту)? С Росархивом как-то контактируете? (Или это секретные сведения, о которых даже не спрашивать?) - будет ли возможность редактирования просматриваемых данных пользователями? - будет ли возможность загрузить свой документ и попробовать его расшифровать? (Скорее всего, нет, а жаль). - будет ли возможность ведения пользователями списков (населенных мест, например)? - собираетесь ли вы в будущем делать этот проект платным? (Провокационный вопрос, конечно. Впрочем, тут уже мелькал на него ответ, в скриншоте с Хабра). --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (2) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
16 февраля 2023 12:30 16 февраля 2023 13:32 --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | Лайк (2) |
tigervera Раменское Сообщений: 523 На сайте с 2020 г. Рейтинг: 951 | Наверх ##
16 февраля 2023 12:37 >> Ответ на сообщение пользователя microArt от 16 февраля 2023 12:23 Поддерживаю, но считаю, что справочники населенных мест следует вести централизованно (как это делает, например, фамилио). --- Еленевские (дух/дв), Ноздровские (дух Смол), Семеновы (дв Рязань), Обернибесовы, Апрелевы (дв Новоладож), Морозовы (чин Тверск/дух Калуж), Новоселовы, Рубцовы, Громовы (дух Тверск), Мякишковы (Торжок), Пахомовы, Климовы (Тула), Гайгеровы (Калуга), Бронницк, Корчевск, Осташковск, Покровск | | Лайк (1) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
16 февраля 2023 12:38 16 февраля 2023 12:42 Сейчас перечитываю там комментарии. Вот xbox пишет, процитирую полностью: [q] Александр, примите в качестве идеи на будущее. У архивов есть большое количество описей дел, которые хранятся в их фондах. Небольшая часть из этих описей переведена в "текстовый" вид, по которому можно проводить поиск. Но бОльшая часть остается "нераспознанной".
К примеру, на сайте ЦГА Москвы выложено ~5500 отсканированных описей в формате PDF и это количество увеличивается. Из всего этого объема, я думаю, текстовый поиск доступен в лучшем случае в ~10%. В каждой описи может быть от нескольких страниц, до нескольких сотен страниц. На одной странице описи может быть до 10-20 заголовков единиц хранения. Т.е. в одной описи максимум может быть до 1-2 тыс записей.
В архивах очень много ценных документов, которые никто не смотрит десятилетиями, просто по той причине, что люди о них не знают. Например, я недавно смотрел ценный документ 17 века, который до меня с 1917года не посмотрел ни один человек... В заголовках дел в описи может быть много интересного. Например, почти по каждому уезду сохранились фонды, хранящие судебные дела. Заголовки в описи примерно такие: "Дело об оскорблении мещанина Иванова Ивана Ивановича мещанином Петровым П.П", "Дело о взыскании купцом Ивановым И.И. долга с ....", "Дело о духовном завещании купца ... своего состояния такой-то церкви и открытия при ней богадельни", "Дело крестьян деревни такой-то к ...". Ходатайства, обвинения, личные дела учащихся, служащих, арестованных итп. Все варианты заголовков не перечисляю. Их огромное количество. Даже в заголовках уже много ценной генеалогической информации. А если кто-то нашел нужный заголовок, то он может дополнительно в архиве посмотреть или удаленно заказать копию дела. А в одном таком деле может быть информации о предке больше, чем во всех остальных источниках.
Я понимаю, что для Яндекса задача распознавания описей в приоритетах далеко не на первых строчках. Но, может быть, когда-нибудь вы и на нее обратите внимание. С технической точки зрения распознавание таких документов намного проще распознавания метрик. Очень многие описи напечатаны на печатной машинке или в типографии, а более старые описи, хоть и написаны от руки, но обычно написаны "современным" почерком и в большинстве случаев имеют четкую структуру.[/q]
Ответ: [q] В этом направлении (наполнение описями и их добавление в поиск) мы также движется. И тут я думаю скоро будут обновления на сервисе.[/q]
По моему личному мнению, такие дела удобно привязывать к карте, к определенному приходу или к деревне, населенному пункту. Просто я когда пробовала составить свою базу данных (в Access, преимущественно, по Порховскому уезду Псковской губернии), то привязывала такие дела (заголовки дел) к приходу. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
|