Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

Яндекс - «Поиск по архивам»

Поиск по распознаным сканам метрических записей! https://yandex.ru/archive

    Вперед →Страницы: ← Назад 1 2 3 4 5 ... ... 205 206 207 208 209 * 210 Вперед →
Модератор: apuzanoff
Imbir
Новичок

Сообщений: 16
На сайте с 2021 г.
Рейтинг: 101
Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье.

Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен.

Надеюсь, будет полезно: https://yandex.ru/archive

Обратная связь с разработчиками.


Пара советов, как задавать им вопросы.
https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064
https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315

Яндекс "Поиск по архивам" в ТГ.

Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы.
Инструкция как открыть все дело, а не только одну найденную страницу от ozerskaya
В помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa

Новости проекта

09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные).
28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323
31.10.2023 Первые итоги осени
  • Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
  • Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
  • В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
  • В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
  • 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами!
14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия».
21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл.
24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник
29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел)
06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник
11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник
15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник
21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник
27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник
12.01.2024 Первые обновления января (источник)

06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. (источник)
25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). (источник)
27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края (источник)
10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. (источник)
16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. (источник)



Лайк (106)
xbox

Сообщений: 1043
На сайте с 2020 г.
Рейтинг: 2159

Yulia2005 написал:
[q]
Там фамилию склоняли на все лады
[/q]
И как в данном случае заключительная звездочка могла бы помочь найти фамилию?

Звездочка у Яндекса ищет любое слово, а не только склоняемую фамилию.

Поэтому звездочка в конце, если бы возвращала результат, то должна была бы возвращать в том числе и такие записи:
- Феодор Федоров священник
- Феодор Федоров руку [приложил]
- Феодор Федоров и [жена его]
...

А если заключительную звездочку у Яндекса не указывать, то... по логике результат должен быть точно такой же.

На сайте epoisk.ru, где я реализовывал отчасти похожий язык запросов, заключительная звездочка не влияет на результат, но она влияет на выделение найденного слова. Т.е. слово выделяется до конца.
Например:
- поиск Звенигород подсветит резульат так: ... Звенигородский ...
- поиск Звенигород* подсветит резульат так: ... Звенигородский ...



---
epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы.
Лайк (4)
dsukharev
Начинающий

Москва
Сообщений: 30
На сайте с 2018 г.
Рейтинг: 29

romanvm написал:
[q]
Yulia2005 написал:
[q]

Но поиск по части слова всё равно не доступен, как я понимаю
[/q]
Такого функционала, к сожалению, у них нет.
[/q]


Отчего же, есть в каком-то объёме. Проверил на Суха*, Сухар*, Сухан* и пр. - результаты похожи на правду, по крайней мере по кол-ву найденного.
К сожалению, предпросмотр в таком режиме не работает, поэтому быстро проверить глазами результаты не получится.

С другой стороны, проверил на Петр, Петр*, Петров - действительно, явно не работает как надо. И с Иванами так же, и с Дмитриями, и даже с Анофреями.
Предполагаю, это из-за оптимизации поиска по именам. Она всё-таки есть в каком-то виде.

С третьей стороны, для воро* - 293К, вороб* - 249К, а ворон* - 515К! Т.е. что-то как-то ищет, но уверенности никакой ))
Лайк (1)
romanvm

romanvm

Россия, г. Ефремов
Сообщений: 5755
На сайте с 2014 г.
Рейтинг: 3694
>> Ответ на сообщение пользователя dsukharev от 28 декабря 2025 2:48
Что-то как-то ищет - это не функционал, это какое-то подобие. Не более того.
---
Вопрошающие, большая просьба - приводите ссылки на документы из общедоступных источников.
Лайк (1)
vedra

vedra

Сообщений: 2045
На сайте с 2015 г.
Рейтинг: 3995

Yulia2005 написал:
[q]
Но поиск по части слова всё равно не доступен, как я понимаю
[/q]

Иногда как раз узнает и отыскивает часть слова или сокращения, особенно в ранних документах. Например, поиск по сокращению "вдва" и "кньз" + фамилия искомого выдает единственный результат. Без сокращений - ничего.
Лайк (2)
Yulia2005

Moscow
Сообщений: 296
На сайте с 2020 г.
Рейтинг: 180
>> Ответ на сообщение пользователя dsukharev от 28 декабря 2025 2:48

Да, действительно, с кавычками работает, но ненадёжно и через раз
ilitvi

ilitvi

Севастополь
Сообщений: 151
На сайте с 2022 г.
Рейтинг: 170
Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?
Все ведь сталкиваются с "галиматьей" "искусственного интеллекта".
Частенько хочется поправить... shok.gif

На FS вполне себе можно исправить ошибки распознавания
Лайк (2)
LonerD
маленьке вовченятко

LonerD

из откуда в никуда
Сообщений: 473
На сайте с 2013 г.
Рейтинг: 530

ilitvi написал:
[q]
Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?
[/q]

Вряд ли напрямую просто так разрешат.
Но добавили задачи по распознаванию на Яндекс.Задания.
Могли бы сделать хоть возможность пометить в "Поиске по архивам" неправильно распознанные строки, и эти фрагменты отправляли бы в свои Задания.
---
Дергунов, Дырдин, Добрынин, Богатырев, Орехов, Берескин, Попов и др. аднадворцы - Сошки и округа || Нагорный и Вергун (Городное), Нелипа (Козиевка), Борисенко (Колонтаев), Ростовский (откуда - ?), Лябах (Юсковцы-Андреевка) - Константиновка | Громѣка (Гадяч), Бурдѣй (Перелюб) - Вознесенка
Лайк (3)
ilitvi

ilitvi

Севастополь
Сообщений: 151
На сайте с 2022 г.
Рейтинг: 170

LonerD написал:
[q]

ilitvi написал:
[q]

Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?
[/q]


Вряд ли напрямую просто так разрешат.
Но добавили задачи по распознаванию на Яндекс.Задания.
Могли бы сделать хоть возможность пометить в "Поиске по архивам" неправильно распознанные строки, и эти фрагменты отправляли бы в свои Задания.
[/q]



Честно говоря, пометки о неправильном распознавании сделали бы сайт похожим на дневник двоечника. Весь в красных чернилах.
Мало что распознано правильно по моим наблюдениям. Отдельные читаемые фрагменты. Но мысль неплохая.
Не знаю как сейчас, но раньше никакое распознавание не обходилось без "ручного труда".
Doble_Ancho
Участник

Doble_Ancho

Москва
Сообщений: 81
На сайте с 2025 г.
Рейтинг: 43

ilitvi написал:
[q]
Интересно, планирует ли Я-архив разрешать пользователям исправлять явные ошибки распознавания текста?
[/q]

Они уже позволяют это делать: можно отправить ссылку на фрагмент (1) по форме "обратная связь" (2). Я пробовал, исправляют.

Прикрепленный файл: ВГД ЯА.png
Лайк (6)
    Вперед →Страницы: ← Назад 1 2 3 4 5 ... ... 205 206 207 208 209 * 210 Вперед →
Модератор: apuzanoff
Вверх ⇈