Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо

Генеалогический форум ВГД

На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!

  ivanru
Профиль
Отзывы
Сообщения
Геометки
Друзья
В друзьях
Древа
GEDCOM

ivanru

Создайте аккаунт или войдите, чтобы отправить личное сообщение этому пользователю и увидеть его полные контактные данные

Сообщения ivanru (13)

Тема: Прошу помощи по поиску документов в ГАЧО
12.04.2022, 0:50


alxtokarev написал:
[q]
Нужна помощь в поиске архивных документов родственников, проживавших в г.Новозыбкове Черниговской Губернии 1907-1913 гг. на возмездной основе. Номера фондов и дел имеются.
[/q]


По идее документы за этот период по Новозыбкову должны быть в ГАБО, а не в ГАЧО.



Тема: Программы для обработки данных из метрических книг
24.03.2022, 22:03

Прочитал тему целиком, взялся за работу, могу сообщить предварительные выводы.

1. Проектов высокой степени готовности не нашел. То что есть обычно имеет ограниченный функционал. О своей работе рассказывал пользователь Rychagov, но до концовки и образца дело не дошло, на форуме его давно нет (

2. Excel, макросы VBA стал бы использовать только для маленьких проектов. Сам я этот вариант пробовал, - уже на нескольких сотнях фамилий понимаешь, что это абсолютно негодные инструменты для построения реляционной базы данных и ее анализа. Ну то есть в принципе делать что-то можно, но это как строить небоскреб из мусора в гараже...
Для первого подхода я выбрал Python + sqllite, т.е. реляционная БД, которая хорошо подходит для наших целей.

3. Существующие решения по распознаванию рукописного текста на текущем этапе не годятся для большинства задач. Ошибок слишком много, причем они концентрируются в критических местах (фамилии, названия населенных пунктов), так что их вычистка обесценивает выигрыш времени от автоматизации распознавания. Их можно использовать для индексации больших массивов (да и то, при условии качественного сканирования) и последующего сервиса первичного поиска по ним. Но для целевой работы отдельных исследователей над "своими" приходами требуется ручной ввод данных. Соответственно основной функционал программы а) ускоренный полуавтоматизированный ввод. б) выстраивание связей и формирование личностей на основе БД.

4. Проблема определения человека по ФИО , в том виде как это обсуждалось в данной теме, по большому счету отсутствует.
Основным структурным элементом базы является запись в метрической книге. Личность должна "создаваться" в результате анализа базы данных, после ее создания. Причем, каждый раз результат может быть иным, т.к. базу можно изменять (уточнять, исправлять ошибки) и дополнять. Выявление однофамильцев, ошибок присущих самим данным - это вопрос качества алгоритма анализа, но не ввода и хранения данных.

5. Ключевая проблема - структуризация или семантический анализ отдельных блоков данных при их вводе.
Например, в Книге рождений достаточно просто структурировать данные о дате и порядковом номере рождения, имени т.к. тут вариаций связанных с формой ввода и положением элемента в последовательности практически нет. Иное дело - текст записи о родителях и крестных, который весьма вариативен.
Сейчас вижу два основных способа решения задачи по разбиению этих блоков на структурные единицы (ФИО отца + его сословие и место жительства, религия, ФИО матери и т.п.).
№1 - структурированный ввод, с оригинальным для программы многовариантным алгоритмом разбиения на структурные единицы, с использованием оговоренных сокращений
№2 - использование готовых модулей семантического анализа, например, Natasha. Это более гибкий инструмент, но полученный результат все-равно нуждается в оригинальной переработке + доп вес программе.
Способы №1,2 можно комбинировать. Но легкого решения нет. Гарантированно будут ошибки для специфичных случаев, но продумал способ с ними бороться: программа на лету разбирает вводимый текст, демонстрируя пользователю "разобранный" вариант и сигнализирует об ошибках и несоответствиях, которые можно будет исправить в отдельных формах заготовленных под каждый структурный элемент.

В моем случае легкораспознаваемый шаблон ручного ввода записи, например, о рождении, может выглядеть так (структурные элементы определяются пробелами и переносом строки при вводе):

3 28 1 март евдокия (РОЖДЕНИЕ - №3 за год рождение (женщины) 28 февраля, крещенной 1 марта)
д полюбово к поликарп тимофеев лазарев васса борисова п (РОДИТЕЛИ: отец - деревни полюбово крестьянин Поликарп Тимофеевич Лазарев...
д починок к иван минаев макашенков д полюбово к евдокия пименова лазарева" (КРЕСТНЫЕ: крестный - деревни Починок крестьянин...


Следует заметить, что часть формируемых данных записи, которая будет сохранена в БД, например пол ребенка, фамилия жены, может определяться программно, после семантического распознавания, а также с учетом значений других структурных элементов (месяц рождения/крещения, лист, информация о священниках исполнявших обряд).

6. Для более качественного анализа и поиска связей потребуется создание нескольких библиотек. В их числе - перечень имен и их вариаций, например: Иван, пол - муж, вариации - Иоан, Иоанн и т.п..

7. Вопросы общей базы и доступности. Один из вариантов -- создание онлайн версии программы, которая бесплатно предоставляет базовый функционал пользователю, взамен на право доступа к введенным им данным (100 и более летней давности - под жесткие ограничения персональных данных не попадаем). Они, очевидно, имеют самостоятельную немалую ценность.




Тема: Программы для обработки данных из метрических книг
24.03.2022, 20:56


Rychagov написал:
[q]
У меня ещё вопрос появился.
Собираюсь основывать базу по приходам.
Приходы привязывать к уездам, которые привязаны к губерниям.
Но ведь случалось так, что менялось территориальное деление - что делать в таком случае?
[/q]


Измените методику. За единицу возьмите не приход, а населенный пункт, который может быть привязан к нескольким разным территориальным единицам (в зависимости от времени) и приходам (иногда даже в один момент времени - встречалось такое).




Тема: Стародуб (город)
13.03.2022, 22:44

>> Ответ на сообщение пользователя ivanich от 25 марта 2011 11:15
Административно территория стародубщины в состав БССР никогда не входила. Гомельская область в первые годы после революции входила в состав РСФСР, позднее, в 20-х годах она была передана в состав БССР без нынешних "брянских" районов.



Тема: Программы для обработки данных из метрических книг
8.03.2022, 23:44

Уже давно в планах написать программу для формирования базы записей метрических книг и ее последующего анализа для идентификации личностей, выявления связей между записями и оценки вероятности совпадений.
Цель у меня прикладная и личная - по некоторым территориям большая часть записей МК не содержит фамилии. Хочется попробовать устанавливать их программно и отыскивать родственников с использованием более поздних данных и поиском совпадений (по вероятным датам рождения, имени, отчеству и т.п.).
Если пойдет - можно сделать и коммерческий продукт.
Основной функционал -- формы ускоренного ввода данных метрических книг. Блок анализа и поиска с вывода потенциальных записей-совпадений, а также формированием списка личностей-предков, с расчетом и выводом вероятности совпадения.

Есть опыт программирования и написания десктопных приложений на Python.

Тема: Genotek
12.01.2021, 1:17


Тампио написал:
[q]
[/q]

По-поводу базы и количества совпаденцев от "Генотека". У меня 80 совпаденцев, в основном указано 3-8 поколение

Тема: Genotek
12.01.2021, 1:16


Genotek написал:
[q]
VGDconvert
[/q]

увы, промокод генотека не работает

Тема: ✔СТАРОДУБСКИЙ ПОЛК (1648-1782)
23.12.2020, 21:11


khrol написал:
[q]
>> Ответ на сообщение пользователя ivanru от 15 декабря 2020 23:34

Да, уже давно разобрался. А захвачен он был именно ВКЛ, которое было частью РП
[/q]


Ну тут с Вами не могу согласиться. Захватывали Стародубовье вместе и делили тоже, и не раз.

В 1535 году во время Стародубской войны осаду Стародуба вели и польские войска под руководством Тарновского, и литовские/литвинские под руководством Радзвилла, они даже ругаться друг с другом умудрялись.
Можно сказать, что поляк Тарновский даже больше отличился и повлиял на судьбу нашего края -- именно он был инициатором Стародубской резни в результате которой было казнено 13 тысяч человек в Стародубе, а потом тоже повторили в Погаре/Радогоще. Хотя рядовые литвины Радзивилла конечно тоже участвовали в этой масштабной бойне .
Интересно, кстати. как это на нас сказалось с точки зрения заселения и генеалогии края? Ведь упомянутые ребята по масштабам локального геноцида далеко переплюнули фашистскую и ордынскую оккупацию вместе взятые. С учетом того, что Стародуб остался под контролем Московского княжества, логичнее ожидать притока населения из его пределов, хотя, возможно, и пленных из литовской земли после походов расселяли... Судя по косвенным данным в конце 1600-х в окрестностях Стародуба было еще пустовато.

В 17-ом веке часть Стародубовья (запад, центр) стало частью литовской короны, а часть, преимущественно нынешний Погарский и Почепский район, частью польских коронных земель. "К тому времени Речь Посполитая все больше походила на унифицированное государство, поэтому разделение на две части для местного населения не принципиально", -- это мнение по вопросу нашего историка Ющенко. Это для них было принципиально с точки зрения землевладения ибо они там с друг другом конфликтовали, разницы между оккупантами для местного населения в общем-то не было,. Я каких-либо различий между двумя местностями не наблюдаю, разве что в топонимике. Хотя Халевичи, вон, Запольские.






Тема: ✔СТАРОДУБСКИЙ ПОЛК (1648-1782)
15.12.2020, 23:34


khrol написал:
[q]
В РГАДА есть интересный документ: "Дозорная книга дворов и населения Стародуба Северского, "письма дозора", Л.Л. Лодыженского и С. Игнатьева". Список 1623/24г.
Может кто-нибудь знает, что это за документ? Или может это не тот Стародуб? Ведь в 1623г. Стародуб уже входил в ВКЛ.
Вот ссылка на этот документ в описи:
http://rgada.info/poisk/index2...ежфондовая опись Книги московских приказов в фондах 137, 138, 141, 144, 145.
страница 42
[/q]


Это как раз тот самый Стародуб, который теперь просто Стародуб.
В этот период он опять был захвачен, но, точнее, не ВКЛ, а Речью Посполитой.


Тема: Стародубский уезд [Раздел - Брянская обл.]
12.12.2020, 0:59

>> Ответ на сообщение пользователя assol1111 от 30 октября 2016 13:21

Вам повезло, один из известных работников архива, краеведов, и специалистов по генеалогии в области - Чеплянская, как раз из этих мест, вероятно совпадение с Човпней и фио вашего родственника у нее не случайно.



Тема: ЗАВАДОВСКИЕ
19.11.2020, 23:06


Tomilina написал:
[q]
Завадовские
Данные 1783 г.
[/q]


В Мглинском уезде (Суражский район) Завадовскому принадлежали какие-то села помимо Ляличей?


Тема: Трубчевский уезд (Раздел - Орловская обл.)
19.11.2020, 0:03


Metelskaya написал:
[q]
Доброго времени, форумчане. Подскажите, как найти место рождения родственников зная лишь уезд? Мы знаем, что прадедушки родились в Трубчевском уезде и всё. Но там было 9 волостей! И они могли родиться в любом селе! Куда двигаться в подобном случае?
[/q]

если знаете фамилии и они не распространенные, попробуйте сверху - поиском по соцсетям




Тема: Стародубский уезд [Раздел - Брянская обл.]
16.11.2020, 1:14


VitAlex написал:
[q]
В метрической книге Христорождественской церкви Староминского куреня ЧКВ за 1834 г. встретилась запись о восприемнике - казаке уездного города Стародуба Черниговской губ. Спиридоне Андреевиче Двибровском.
[/q]

Возможно один из супругов (скорее - жена) была с ним родственником.