Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

Яндекс - «Поиск по архивам»

Поиск по распознаным сканам метрических записей! https://yandex.ru/archive

← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 152 153 154 155 156 * 157 158 159 160 ... 195 196 197 198 199 200 Вперед →
Модератор: apuzanoff
Imbir
Новичок

Сообщений: 16
На сайте с 2021 г.
Рейтинг: 99
Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье.

Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен.

Надеюсь, будет полезно: https://yandex.ru/archive

Обратная связь с разработчиками.


Пара советов, как задавать им вопросы.
https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064
https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315

Яндекс "Поиск по архивам" в ТГ.

Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы.
Инструкция как открыть все дело, а не только одну найденную страницу от ozerskaya
В помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa

Новости проекта

09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные).
28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323
31.10.2023 Первые итоги осени
  • Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
  • Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
  • В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
  • В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
  • 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами!
14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия».
21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл.
24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник
29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел)
06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник
11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник
15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник
21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник
27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник
12.01.2024 Первые обновления января (источник)

06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. (источник)
25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). (источник)
27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края (источник)
10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. (источник)
16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. (источник)



Лайк (106)
a-KaDeMi-k

a-KaDeMi-k

Сообщений: 1902
На сайте с 2011 г.
Рейтинг: 2624

PedigreeResearcher написал:
[q]
О чём шумим?
[/q]



Коллеги, Александр, все ж, думаю, выбрал неверное слово.

Вопрос, скорее, не про "эффективность", а про "качество" распознавания. Т.е. о попытке оценить, сколько информации пользователь упустит/потеряет, если безоговорочно доверится результатам Яндекса и не проведёт дополнительную "глазную" работу.

Условно, в документе 10 раз встречается фамилия "Иванов". Яндекс смог найти её только в пяти случаях. Следовательно, некий показатель качества распознавания - 50%



Про то, что чтобы найти первые 5 упоминаний мы можем потратить 1 минуту, а остальные 5 ("глазные") ещё 1 час... 1 сутки... бесконечность - это совсем другое.
---
*** Проект открытой публикации ревизских сказок Орловщины ***

Бырылов Веселов Геронтьев Губин Еремиев Зорин Зубович Калёнов Кравцов Куцев Лазебник Неженцев Ноздрин Ретинский Семёнов Сорокин Сочков Сычкин Филатов Цветков
Лайк (3)
7_kolen_predkov

ДиВанное заМКАДье
Сообщений: 1032
На сайте с 2021 г.
Рейтинг: 3391
Информация из Телеграмма ЯА
[q]
Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей. Самые ранние записи датированы 1802 годом, самые поздние — 1920-м.

Интересно, что хранились эти важные для истории Урала материалы не в региональном архиве, а в библиотеке Екатеринбургской духовной семинарии. Вероятно, там они оказались благодаря церковным историкам, которые в конце советского периода, когда метрические книги массово списывали в утиль из архивов и ЗАГСов, смогли спасти эти документы от уничтожения. А уже в наши дни энтузиасты из проекта «Память Урала» и волонтеры оцифровали эти дела и выложили в общий доступ. Получилось около 13 тысяч электронных изображений, теперь расшифрованных нашей нейросетью и доступных для полнотекстового поиска.

Публикация этих материалов — еще один пример того, что для появления новых документов в «Поиске по архивам» достаточно инициативы со стороны партнера: архива, библиотеки или, как в данном случае, группы энтузиастов. Верим, что таких примеров будет больше; следите за нашими новостями!
[/q]
Лайк (8)
anto

Сообщений: 5790
На сайте с 2009 г.
Рейтинг: 4442
https://dzen.ru/a/Zh00X9dwmWzpD_6d
Вот еще один ответ Росархива - ""Федеральное архивное агентство (Росархив) рассмотрело Ваше обращение по вопросу размещения метрических книг Российского государственного исторического архива Дальнего Востока в сервисе Яндекса "Поиск по архивам" и сообщает, что с пониманием относится к пожеланиям пользователей относительно размещения в сети Интернет архивных документов, содержащих сведения генеалогического характера.

Однако следует отметить, что при всех достоинствах удалённого использования, его бесконтрольное и неограниченное внедрение несёт в себе существенные риски.

Росархив ведёт переговоры с компанией Яндекс и готов рассмотреть вопрос о заключении соглашения об информационном взаимодействии с учётом организации такого взаимодействия с исключением либо компенсацией на достаточном уровне всех рисков"."
Лайк (1)
ELM

Санкт-Петербург
Сообщений: 1013
На сайте с 2014 г.
Рейтинг: 585

a-KaDeMi-k написал:
[q]
Условно, в документе 10 раз встречается фамилия "Иванов". Яндекс смог найти её только в пяти случаях. Следовательно, некий показатель качества распознавания - 50%



Про то, что чтобы найти первые 5 упоминаний мы можем потратить 1 минуту, а остальные 5 ("глазные") ещё 1 час... 1 сутки... бесконечность - это совсем другое.
[/q]

В таком ключе Имхо эффективность 30% первично, и меняя формы написания её можно повысить до 50-70%, может чуть больше.
Но тут принципиально, что действительно без ИИ некоторые документы практически невозможно найти вообще.
P. S. В Яндекс Архив больше проблема в слишком простом ИИ, очень уж простой по сути, не ориентирован на распознавание имён, как таковых. Уверен его можно оптимизировать, но не знаю как, так как далёк от этой темы.
В любом случае польза от него конечно колоссальная, даже в таком полуфабрикатном виде.
---
Новоладожский уезд: Забелкин, Савин;
Рига: Lukaschewitz;
Санкт-Петербург:Оттов;
Беларусь: Матюшенок, Юрковец, Кривонос;
Весьегонский уезд: Морозов, Трусов;
Германия: Schwedler;
Кострома: Приданников;
Молвитино: Смагин, Коломинский;
Финляндия: Tjusman;
Лайк (1)
apuzanoff
Модератор раздела

Ставропольский край
Сообщений: 2328
На сайте с 2017 г.
Рейтинг: 1471

anto написал:
[q]
Однако следует отметить, что при всех достоинствах удалённого использования, его бесконтрольное и неограниченное внедрение несёт в себе существенные риски.
[/q]
Вот интересно о каких же таких рисках думают чиновники от архивов, когда это пишут...
Риски того, что потомки людей смогут найти информацию о своих предках, которую без удаленного доступа к документам и ИИ для их распознавания (пусть и с качеством в 70/50/30%) вообще никто никогда бы не нашел ? confused.gif
Или всё же риски потерять доход от оказания платных услуг (официальных и неофициальных через "кротов") smile_030.gif
Лайк (12)
balt-amber

Сообщений: 848
На сайте с 2011 г.
Рейтинг: 450
Из ответа Росархива:
[q]
"Однако следует отметить, что при всех достоинствах удалённого использования, его бесконтрольное и неограниченное внедрение несёт в себе существенные риски."
[/q]

Что за бесконтрольное и неограниченное внедрение? Какие такие "существенные риски"?
Какая-то билиберда.
---
Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда
Лайк (4)
a-KaDeMi-k

a-KaDeMi-k

Сообщений: 1902
На сайте с 2011 г.
Рейтинг: 2624

anto написал:
[q]
при всех достоинствах удалённого использования, его бесконтрольное и неограниченное внедрение несёт в себе существенные риски
[/q]

То ли сегодня день такой, но мне в голову не приходят не то что "существенные", но и вообще любые риски от удаленного изучения документов, которые я бы мог без того же самого риска получить в читальных залах архивов.


Риск, что хакеры залезут в сеть архива (или даже самого Яндекса shok.gif ) и узнают, "кто убил Кенеди?"
Риск, что будет покупаться меньше ж/д и авиабилетов, чтобы посетить архив? Меньше оплат в гостиницах, туристического сбора? dntknw.gif

А! Понял!
Критический риск, что Вася Пупкин в четверг не приедет в архив в "деревню Гадюкино", не встретит там Гюльчатай - любовь всей своей жизни, они не родят сына, внук которого с IQ=247.15 не предотвратит катастрофу на звездолете при полёте к альфа-Центавра (но только при условии, что Аннушка не разольет масло)!

Ну, так бы сразу и написали! Чего скрывать то!

Коллеги, подкиньте идеек про риск. Я не понимаю. Наверно, действительно не гожусь в управленцы, например, Росархива. Пойду, отзову резюме.
confuse.gif
---
*** Проект открытой публикации ревизских сказок Орловщины ***

Бырылов Веселов Геронтьев Губин Еремиев Зорин Зубович Калёнов Кравцов Куцев Лазебник Неженцев Ноздрин Ретинский Семёнов Сорокин Сочков Сычкин Филатов Цветков
Лайк (6)
KoLenka

KoLenka

Питерская я
Сообщений: 2339
На сайте с 2021 г.
Рейтинг: 12886

anto написал:
[q]
его бесконтрольное и неограниченное внедрение несёт в себе существенные риски.
[/q]

Они хотели написать безденежное для архива, видимо.
Но , постеснялись sad.gif
Михаха

Михаха

Сообщений: 4134
На сайте с 2008 г.
Рейтинг: 3830

KoLenka написал:
[q]
Они хотели написать безденежное для архива, видимо.
Но , постеснялись
[/q]

Если бы архивисты, перед тем как написать ответ, советовались со мной, я бы сказал так:
1. Сведения из архива в Яндекс могут передаваться или по онлайн-запросу или массивом.
2. В первом случае возникает риск, что маскируясь под "хороший" запрос Яндекса, написанный Коленкой скрипт на Питоне высосет все сведения в личную базу Лены.
3. Во втором случае, сведения, доступ к которым имеет считанное число сотрудников архива, попадет на серверы Яндекса и теоретический доступ к ним будут иметь несколько тысяч сотрудников Яндекса.

То есть, при сотрудничестве с Я-архивом, риски утечки данных, которые архив считает своими, возрастают.
Лайк (4)
Wladzislaw

Частный специалист

Менск (Беларусь)
Сообщений: 3877
На сайте с 2003 г.
Рейтинг: 2016

a-KaDeMi-k написал:
[q]
внук которого с IQ=247.15
[/q]

IQ48 знаю, а вот 247... Если на пару с Гюльчатай, тоже неплохо.
---
Собрание Белорусской Шляхты — nobility.by

Исследования на заказ: Беларусь (шляхта), Литва (шляхта), Латвия (шляхта Латгалии и Курляндии; католики), Украина (шляхта; католики Киевщины, Волыни, Черниговщины), Россия (дворяне; католики). В Личные — только заказы.
Жалоба (1)
← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 152 153 154 155 156 * 157 158 159 160 ... 195 196 197 198 199 200 Вперед →
Модератор: apuzanoff
Вверх ⇈