Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

Яндекс - «Поиск по архивам»

Поиск по распознаным сканам метрических записей! https://yandex.ru/archive

← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 29 30 31 32  33 34 35 36 37 ... 195 196 197 198 199 200 Вперед →
Модератор: apuzanoff
Imbir
Новичок

Сообщений: 16
На сайте с 2021 г.
Рейтинг: 99
Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье.

Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен.

Надеюсь, будет полезно: https://yandex.ru/archive

Обратная связь с разработчиками.


Пара советов, как задавать им вопросы.
https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064
https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315

Яндекс "Поиск по архивам" в ТГ.

Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы.
Инструкция как открыть все дело, а не только одну найденную страницу от ozerskaya
В помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa

Новости проекта

09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные).
28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323
31.10.2023 Первые итоги осени
  • Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
  • Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
  • В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
  • В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
  • 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами!
14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия».
21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл.
24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник
29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел)
06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник
11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник
15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник
21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник
27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник
12.01.2024 Первые обновления января (источник)

06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. (источник)
25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). (источник)
27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края (источник)
10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. (источник)
16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. (источник)



Лайк (106)
poisktob

Сообщений: 573
На сайте с 2016 г.
Рейтинг: 306

Ekaterinburg написал:
[q]
Вот тут Штопор, пожалуй, не один из..., а лучший
---
[/q]

Присоединяюсь.
---
тоб
Лайк (3)
balt-amber

Сообщений: 850
На сайте с 2011 г.
Рейтинг: 452
Мне здорово помогла в прочтении текста elena_krd. Заметила то, что другие не увидели, считаю ее тоже высококвалифицированным специалистом. Правда, обращался за помощью уже давно.
---
Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда
Лайк (1)
microArt

microArt

г.Гатчина, Ленинградская область
Сообщений: 3298
На сайте с 2008 г.
Рейтинг: 2489
Лично я хотела узнать у представителя Яндекса о том:
- какие перспективы у вашего проекта? Есть ли сведения, что и другие архивы присоединятся к проекту? Какие требования выдвигают архивы (чтобы присоединиться к проекту)? С Росархивом как-то контактируете? (Или это секретные сведения, о которых даже не спрашивать?)
- будет ли возможность редактирования просматриваемых данных пользователями?
- будет ли возможность загрузить свой документ и попробовать его расшифровать? (Скорее всего, нет, а жаль).
- будет ли возможность ведения пользователями списков (населенных мест, например)?
- собираетесь ли вы в будущем делать этот проект платным? (Провокационный вопрос, конечно. Впрочем, тут уже мелькал на него ответ, в скриншоте с Хабра).
---
Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/
Лайк (2)
microArt

microArt

г.Гатчина, Ленинградская область
Сообщений: 3298
На сайте с 2008 г.
Рейтинг: 2489
Imbir, добавьте, пожалуйста, в первое сообщение ссылки:

Обратная связь с разработчиками.
https://yandex.ru/archive/feedback

Пара советов, как задавать им вопросы.
https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064
https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315

Как Яндекс научился распознавать, что написано в рукописных архивах.
Статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы.
https://habr.com/ru/company/yandex/blog/712510/
---
Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/
Лайк (2)
tigervera

tigervera

Раменское
Сообщений: 523
На сайте с 2020 г.
Рейтинг: 951
>> Ответ на сообщение пользователя microArt от 16 февраля 2023 12:23
Поддерживаю, но считаю, что справочники населенных мест следует вести централизованно (как это делает, например, фамилио).

---
Еленевские (дух/дв), Ноздровские (дух Смол), Семеновы (дв Рязань), Обернибесовы, Апрелевы (дв Новоладож), Морозовы (чин Тверск/дух Калуж), Новоселовы, Рубцовы, Громовы (дух Тверск), Мякишковы (Торжок), Пахомовы, Климовы (Тула), Гайгеровы (Калуга), Бронницк, Корчевск, Осташковск, Покровск
Лайк (1)
microArt

microArt

г.Гатчина, Ленинградская область
Сообщений: 3298
На сайте с 2008 г.
Рейтинг: 2489
Сейчас перечитываю там комментарии.

Вот xbox пишет, процитирую полностью:
[q]
Александр, примите в качестве идеи на будущее. У архивов есть большое количество описей дел, которые хранятся в их фондах. Небольшая часть из этих описей переведена в "текстовый" вид, по которому можно проводить поиск. Но бОльшая часть остается "нераспознанной".

К примеру, на сайте ЦГА Москвы выложено ~5500 отсканированных описей в формате PDF и это количество увеличивается. Из всего этого объема, я думаю, текстовый поиск доступен в лучшем случае в ~10%. В каждой описи может быть от нескольких страниц, до нескольких сотен страниц. На одной странице описи может быть до 10-20 заголовков единиц хранения. Т.е. в одной описи максимум может быть до 1-2 тыс записей.

В архивах очень много ценных документов, которые никто не смотрит десятилетиями, просто по той причине, что люди о них не знают. Например, я недавно смотрел ценный документ 17 века, который до меня с 1917года не посмотрел ни один человек... В заголовках дел в описи может быть много интересного. Например, почти по каждому уезду сохранились фонды, хранящие судебные дела. Заголовки в описи примерно такие: "Дело об оскорблении мещанина Иванова Ивана Ивановича мещанином Петровым П.П", "Дело о взыскании купцом Ивановым И.И. долга с ....", "Дело о духовном завещании купца ... своего состояния такой-то церкви и открытия при ней богадельни", "Дело крестьян деревни такой-то к ...". Ходатайства, обвинения, личные дела учащихся, служащих, арестованных итп. Все варианты заголовков не перечисляю. Их огромное количество. Даже в заголовках уже много ценной генеалогической информации. А если кто-то нашел нужный заголовок, то он может дополнительно в архиве посмотреть или удаленно заказать копию дела. А в одном таком деле может быть информации о предке больше, чем во всех остальных источниках.

Я понимаю, что для Яндекса задача распознавания описей в приоритетах далеко не на первых строчках. Но, может быть, когда-нибудь вы и на нее обратите внимание. С технической точки зрения распознавание таких документов намного проще распознавания метрик. Очень многие описи напечатаны на печатной машинке или в типографии, а более старые описи, хоть и написаны от руки, но обычно написаны "современным" почерком и в большинстве случаев имеют четкую структуру.
[/q]

Ответ:
[q]
В этом направлении (наполнение описями и их добавление в поиск) мы также движется. И тут я думаю скоро будут обновления на сервисе.
[/q]


По моему личному мнению, такие дела удобно привязывать к карте, к определенному приходу или к деревне, населенному пункту. Просто я когда пробовала составить свою базу данных (в Access, преимущественно, по Порховскому уезду Псковской губернии), то привязывала такие дела (заголовки дел) к приходу.
---
Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/
balt-amber

Сообщений: 850
На сайте с 2011 г.
Рейтинг: 452
Ой, а ещё бы постановления казённых палат, и может быть и каких других органов власти о переводе (переселении) крестьян.
---
Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда
dobby

dobby

Минск, Беларусь
Сообщений: 5241
На сайте с 2013 г.
Рейтинг: 4924

microArt написал:
[q]
К примеру, на сайте ЦГА Москвы выложено ~5500 отсканированных описей в формате PDF и это количество увеличивается. Из всего этого объема, я думаю, текстовый поиск доступен в лучшем случае в ~10%. В каждой описи может быть от нескольких страниц, до нескольких сотен страниц. На одной странице описи может быть до 10-20 заголовков единиц хранения. Т.е. в одной описи максимум может быть до 1-2 тыс записей.
[/q]

Есть, к примеру, сервис hryc.by, в котором как раз и проводится поиск по описям нескольких десятков архивов. Может, конечно, Яндекс сделает лучше, но это реально существующий сервис уже сейчас.
---
Мой дневник
Нет неинтересных родословных - есть недоисследованные
Лайк (3)
microArt

microArt

г.Гатчина, Ленинградская область
Сообщений: 3298
На сайте с 2008 г.
Рейтинг: 2489
Я карту хочу. На ней отмечен приход, а по приходу - дела (в разных архивах), которые относятся к этому приходу.
Ну, или дела, относящиеся к некоторой деревне.

Пример. На карте отмечен приход во имя Грузинской иконы Божией Матери в селе Богородицкое Порховского уезда Псковской области. Список деревень известен (по состоянию на 1913 год):
село Хохловы Горки, Запольский Ям; деревни: Большие Замошки, Большое Колотилово, Борзилец, Батино, Вышково, Гнилки, Губошино, Гусли, Заполье, Злятино, Козьян, Малые Замошки, Малое Колотилово, Петрищево, Поддубье, Сивково, Шилы.

И вот такой список архивных дел по приходу (смотрите приложенный файл Excel). В основном, дела из псковского архива, но есть и другие архивы (ГАНО, ЦГИА в Петербурге). Список, конечно, не полный - на что хватило моего терпения, если честно.

Файл Документы прихода Богородицкое в разных архивах.zip, 18 Кб

По крестьянам есть выкупные дела. Выкупные дела по Псковской губернии хранятся в петербургском РГИА, фонд 577, опись 31, и в Псковском архиве (ГАПО).
Там указана деревня (и помещик). Их тоже можно к карте (к деревне или приходу) привязать.
---
Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/
Лайк (1)
solo_vv

solo_vv

Санкт-Петербург
Сообщений: 805
На сайте с 2018 г.
Рейтинг: 1046
Присоединюсь к конструктивным постам, которые были выше. Если есть желание улучшить сервис Яндекс Архив, то выше написано много четко и по делу. Если есть ошибка, то ее надо четко и понятно описать.

По поводу дальнейших планов наполнения сервиса Яндекса «Поиск по архивам».

Совершенно очевидно, что планы эти есть, и с нами ими никто не поделится). То, что Яндекс начал заниматься этим проектом, значит то, что если сюда пошел бизнес, значит бизнес понял как на этом можно заработать. Пока Росархив разрабатывает какой то там Электронный читальный зал, помните, была такая новость в 2018 году https://forum.vgd.ru/615/93775 Яндекс берет и делает. Возможно, этот проект реализуется в рамках какого то гранта, сказать сложно. Нам как пользователям это не должно быть особо интересно. Важно то, что этот проект стартовал, и то, что уже получилось это невероятно круто. Направления развития у сервиса большие. Если сделанный «движок» будут постоянно совершенствовать и отлаживать, то спектр применения у него может быть очень широк. Помимо основного текущего сервиса, можно сделать и пускай даже и платную возможность пользователям загружать и распознавать свои документы. Или сделать подключаемый модуль для уже разработанных других информационных систем, которые уже реализованы и работают у других архивов. Многие архивы уже обзавелись своими АИСами, многие с платным доступом. Отказаться от них и передать все наработанное годами Яндексу они вряд ли захотят. Но это дело будущего. Не очень как мне кажется далекого. Есть еще библиотеки в которых есть рукописи. Тут еще много чего можно нафантазировать.

Другой вопрос. За счет, каких архивов Яндекс Архив будет наполнять свой сервис?
Видится несколько вариантов таких архивов:
1. Архивы, которые имеют оборудования для сканирования, годами сканируют, имеют большое количество отсканированных дел, свои АИСы, которые позволяют выкладывать отсканированное в общий доступ в интернет. И которые делают это бесплатно, для нас для пользователей. И первым в этом списке конечно ЦГА Москвы, на базе которого и начался видимо проект Яндекса. Новгородский архив если я правильно понял также подходит по всем этим критериям и отлично вписывается в эту категорию. Эти архивы и так предоставляют бесплатный доступ к своим оцифрованным делам, поэтому передача материалов для Яндекса им только в плюс. Таких архивов, правда немного.
2. Архивы, которые имеют оборудования для сканирования, годами сканируют, имеют большое количество отсканированных дел, НО которые у них доступны только в читальном зале. Таких архивов уже больше. И Оренбургский архив как раз и относится к таким. Отсканировано много, но денег на свою АИС нет. Думаю, что такие архивы будут на первых порах основой наполнения нового сервиса Яндекса.
3. Архивы которые имеют все то что в п.1, только предоставляют доступ к оцифрованным образам на платной основе. Чтобы с ними была достигнута договоренность, у этих архивов должна быть материальная заинтересованность. Как она может быть достигнута, не могу сказать. Как вариант сотрудничества как я писал выше, если Яндекс сможет сделать модуль для таких систем, и эти архивы в рамках своих АИС смогут использовать машинную индексацию дел OCR Яндекса.
Архивы у которых нет оборудования для сканирования рассматривать нет смысла.

Все что я написал выше, мои небольшие мысли на эту тему, не более того. В реальности может быть совсем по-другому. Но всем интересно как будет развиваться новый сервис и с какими другими архивами будет достигнута договоренность о том, что именно их документы будут предоставлены для Яндекс Архива. Мне тоже интересно, поэтому я написал два запроса в Архивный комитет Санкт-Петербурга и Архивный Комитет Тверской области с простым вопросом: общались ли эти архивные комитеты с Яндексом на эту тему. Сегодня получил первый ответ от Архивного комитета Санкт-Петербурга.
Его прикладываю к посту:
"По Вашему обращению, поступившему на сервис «Электронная приемная» на официальном сайте Администрации Санкт-Петербурга в информационно-телекоммуникационной сети «Интернет», о возможности предоставления оцифрованных образов документов санкт-петербургских государственных архивов для сервиса Яндекса «Поиск по архивам» сообщаем, что предложений об участии в данном проекте от компании Яндекс в Архивный комитет Санкт-Петербурга не поступало."

Ответ был ожидаем. Но я считаю, что всегда лучше задать вопрос и получить ответ, чем додумывать ответ за кого-либо. Если читающим этим строки также интересно по своим архивам, ведутся ли в ваших городах такие переговоры, сделайте запрос архивному комитету или тому ведомству в подчинении которого находятся ваши архивы, и потом поделитесь ответом, здесь на форуме. Может быть ваш запрос будет новой информацией для архива о запущенном сервисе Яндекса и побудит их руководителей сделать первый шаг в сторону переговоров. Наивно, да? Возможно, но лично я попробовал. Как получу ответ от Архивного комитета Тверской области опубликую его здесь же. Всем интересных открытий с Яндекс Архивом!

Прикрепленный файл: 23-0-1.jpg
---
Соловьевы (Тверская губ. Вышневолоцкий у. Парьевская вол.)
Федулаевы (Петроградская губ. Гдовский у. Скарятинская вол.)
Одинцовы (Тверская губ. Калязинский у. Поречская вол.)
Гранильщиковы (Московская губ. Верейский у. Смолинская вол.)
http://forum.vgd.ru/3513/
Лайк (12)
← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 ... 29 30 31 32  33 34 35 36 37 ... 195 196 197 198 199 200 Вперед →
Модератор: apuzanoff
Вверх ⇈