 | ivanruСоздайте аккаунт или войдите, чтобы отправить личное сообщение этому пользователю и увидеть его полные контактные данные |
Сообщения ivanru (13)Тема: Прошу помощи по поиску документов в ГАЧО 12.04.2022, 0:50
alxtokarev написал:[q] Нужна помощь в поиске архивных документов родственников, проживавших в г.Новозыбкове Черниговской Губернии 1907-1913 гг. на возмездной основе. Номера фондов и дел имеются.[/q]
По идее документы за этот период по Новозыбкову должны быть в ГАБО, а не в ГАЧО.
|
Тема: Программы для обработки данных из метрических книг 24.03.2022, 22:03
Прочитал тему целиком, взялся за работу, могу сообщить предварительные выводы.
1. Проектов высокой степени готовности не нашел. То что есть обычно имеет ограниченный функционал. О своей работе рассказывал пользователь Rychagov, но до концовки и образца дело не дошло, на форуме его давно нет (
2. Excel, макросы VBA стал бы использовать только для маленьких проектов. Сам я этот вариант пробовал, - уже на нескольких сотнях фамилий понимаешь, что это абсолютно негодные инструменты для построения реляционной базы данных и ее анализа. Ну то есть в принципе делать что-то можно, но это как строить небоскреб из мусора в гараже... Для первого подхода я выбрал Python + sqllite, т.е. реляционная БД, которая хорошо подходит для наших целей.
3. Существующие решения по распознаванию рукописного текста на текущем этапе не годятся для большинства задач. Ошибок слишком много, причем они концентрируются в критических местах (фамилии, названия населенных пунктов), так что их вычистка обесценивает выигрыш времени от автоматизации распознавания. Их можно использовать для индексации больших массивов (да и то, при условии качественного сканирования) и последующего сервиса первичного поиска по ним. Но для целевой работы отдельных исследователей над "своими" приходами требуется ручной ввод данных. Соответственно основной функционал программы а) ускоренный полуавтоматизированный ввод. б) выстраивание связей и формирование личностей на основе БД.
4. Проблема определения человека по ФИО , в том виде как это обсуждалось в данной теме, по большому счету отсутствует. Основным структурным элементом базы является запись в метрической книге. Личность должна "создаваться" в результате анализа базы данных, после ее создания. Причем, каждый раз результат может быть иным, т.к. базу можно изменять (уточнять, исправлять ошибки) и дополнять. Выявление однофамильцев, ошибок присущих самим данным - это вопрос качества алгоритма анализа, но не ввода и хранения данных.
5. Ключевая проблема - структуризация или семантический анализ отдельных блоков данных при их вводе. Например, в Книге рождений достаточно просто структурировать данные о дате и порядковом номере рождения, имени т.к. тут вариаций связанных с формой ввода и положением элемента в последовательности практически нет. Иное дело - текст записи о родителях и крестных, который весьма вариативен. Сейчас вижу два основных способа решения задачи по разбиению этих блоков на структурные единицы (ФИО отца + его сословие и место жительства, религия, ФИО матери и т.п.). №1 - структурированный ввод, с оригинальным для программы многовариантным алгоритмом разбиения на структурные единицы, с использованием оговоренных сокращений №2 - использование готовых модулей семантического анализа, например, Natasha. Это более гибкий инструмент, но полученный результат все-равно нуждается в оригинальной переработке + доп вес программе. Способы №1,2 можно комбинировать. Но легкого решения нет. Гарантированно будут ошибки для специфичных случаев, но продумал способ с ними бороться: программа на лету разбирает вводимый текст, демонстрируя пользователю "разобранный" вариант и сигнализирует об ошибках и несоответствиях, которые можно будет исправить в отдельных формах заготовленных под каждый структурный элемент.
В моем случае легкораспознаваемый шаблон ручного ввода записи, например, о рождении, может выглядеть так (структурные элементы определяются пробелами и переносом строки при вводе):
3 28 1 март евдокия (РОЖДЕНИЕ - №3 за год рождение (женщины) 28 февраля, крещенной 1 марта) д полюбово к поликарп тимофеев лазарев васса борисова п (РОДИТЕЛИ: отец - деревни полюбово крестьянин Поликарп Тимофеевич Лазарев... д починок к иван минаев макашенков д полюбово к евдокия пименова лазарева" (КРЕСТНЫЕ: крестный - деревни Починок крестьянин...
Следует заметить, что часть формируемых данных записи, которая будет сохранена в БД, например пол ребенка, фамилия жены, может определяться программно, после семантического распознавания, а также с учетом значений других структурных элементов (месяц рождения/крещения, лист, информация о священниках исполнявших обряд).
6. Для более качественного анализа и поиска связей потребуется создание нескольких библиотек. В их числе - перечень имен и их вариаций, например: Иван, пол - муж, вариации - Иоан, Иоанн и т.п..
7. Вопросы общей базы и доступности. Один из вариантов -- создание онлайн версии программы, которая бесплатно предоставляет базовый функционал пользователю, взамен на право доступа к введенным им данным (100 и более летней давности - под жесткие ограничения персональных данных не попадаем). Они, очевидно, имеют самостоятельную немалую ценность.
|
Тема: Программы для обработки данных из метрических книг 24.03.2022, 20:56
Rychagov написал:[q] У меня ещё вопрос появился. Собираюсь основывать базу по приходам. Приходы привязывать к уездам, которые привязаны к губерниям. Но ведь случалось так, что менялось территориальное деление - что делать в таком случае?[/q]
Измените методику. За единицу возьмите не приход, а населенный пункт, который может быть привязан к нескольким разным территориальным единицам (в зависимости от времени) и приходам (иногда даже в один момент времени - встречалось такое).
|
Тема: Стародуб (город) 13.03.2022, 22:44
>> Ответ на сообщение пользователя ivanich от 25 марта 2011 11:15 Административно территория стародубщины в состав БССР никогда не входила. Гомельская область в первые годы после революции входила в состав РСФСР, позднее, в 20-х годах она была передана в состав БССР без нынешних "брянских" районов.
|
Тема: Программы для обработки данных из метрических книг 8.03.2022, 23:44
Уже давно в планах написать программу для формирования базы записей метрических книг и ее последующего анализа для идентификации личностей, выявления связей между записями и оценки вероятности совпадений. Цель у меня прикладная и личная - по некоторым территориям большая часть записей МК не содержит фамилии. Хочется попробовать устанавливать их программно и отыскивать родственников с использованием более поздних данных и поиском совпадений (по вероятным датам рождения, имени, отчеству и т.п.). Если пойдет - можно сделать и коммерческий продукт. Основной функционал -- формы ускоренного ввода данных метрических книг. Блок анализа и поиска с вывода потенциальных записей-совпадений, а также формированием списка личностей-предков, с расчетом и выводом вероятности совпадения.
Есть опыт программирования и написания десктопных приложений на Python.
|
Тема: Genotek 12.01.2021, 1:17
Тампио написал:[q] [/q]
По-поводу базы и количества совпаденцев от "Генотека". У меня 80 совпаденцев, в основном указано 3-8 поколение
|
Тема: Genotek 12.01.2021, 1:16
Genotek написал:[q] VGDconvert[/q]
увы, промокод генотека не работает
|
Тема: ✔СТАРОДУБСКИЙ ПОЛК (1648-1782) 23.12.2020, 21:11
khrol написал:[q] >> Ответ на сообщение пользователя ivanru от 15 декабря 2020 23:34
Да, уже давно разобрался. А захвачен он был именно ВКЛ, которое было частью РП [/q]
Ну тут с Вами не могу согласиться. Захватывали Стародубовье вместе и делили тоже, и не раз.
В 1535 году во время Стародубской войны осаду Стародуба вели и польские войска под руководством Тарновского, и литовские/литвинские под руководством Радзвилла, они даже ругаться друг с другом умудрялись. Можно сказать, что поляк Тарновский даже больше отличился и повлиял на судьбу нашего края -- именно он был инициатором Стародубской резни в результате которой было казнено 13 тысяч человек в Стародубе, а потом тоже повторили в Погаре/Радогоще. Хотя рядовые литвины Радзивилла конечно тоже участвовали в этой масштабной бойне . Интересно, кстати. как это на нас сказалось с точки зрения заселения и генеалогии края? Ведь упомянутые ребята по масштабам локального геноцида далеко переплюнули фашистскую и ордынскую оккупацию вместе взятые. С учетом того, что Стародуб остался под контролем Московского княжества, логичнее ожидать притока населения из его пределов, хотя, возможно, и пленных из литовской земли после походов расселяли... Судя по косвенным данным в конце 1600-х в окрестностях Стародуба было еще пустовато.
В 17-ом веке часть Стародубовья (запад, центр) стало частью литовской короны, а часть, преимущественно нынешний Погарский и Почепский район, частью польских коронных земель. "К тому времени Речь Посполитая все больше походила на унифицированное государство, поэтому разделение на две части для местного населения не принципиально", -- это мнение по вопросу нашего историка Ющенко. Это для них было принципиально с точки зрения землевладения ибо они там с друг другом конфликтовали, разницы между оккупантами для местного населения в общем-то не было,. Я каких-либо различий между двумя местностями не наблюдаю, разве что в топонимике. Хотя Халевичи, вон, Запольские.
|
Тема: ✔СТАРОДУБСКИЙ ПОЛК (1648-1782) 15.12.2020, 23:34
khrol написал:[q] В РГАДА есть интересный документ: "Дозорная книга дворов и населения Стародуба Северского, "письма дозора", Л.Л. Лодыженского и С. Игнатьева". Список 1623/24г. Может кто-нибудь знает, что это за документ? Или может это не тот Стародуб? Ведь в 1623г. Стародуб уже входил в ВКЛ. Вот ссылка на этот документ в описи: http://rgada.info/poisk/index2...ежфондовая опись Книги московских приказов в фондах 137, 138, 141, 144, 145. страница 42
[/q]
Это как раз тот самый Стародуб, который теперь просто Стародуб. В этот период он опять был захвачен, но, точнее, не ВКЛ, а Речью Посполитой.
|
Тема: Стародубский уезд [Раздел - Брянская обл.] 12.12.2020, 0:59
>> Ответ на сообщение пользователя assol1111 от 30 октября 2016 13:21
Вам повезло, один из известных работников архива, краеведов, и специалистов по генеалогии в области - Чеплянская, как раз из этих мест, вероятно совпадение с Човпней и фио вашего родственника у нее не случайно.
|
Тема: ЗАВАДОВСКИЕ 19.11.2020, 23:06
Tomilina написал:[q] Завадовские Данные 1783 г.
[/q]
В Мглинском уезде (Суражский район) Завадовскому принадлежали какие-то села помимо Ляличей?
|
Тема: Трубчевский уезд (Раздел - Орловская обл.) 19.11.2020, 0:03
Metelskaya написал:[q] Доброго времени, форумчане. Подскажите, как найти место рождения родственников зная лишь уезд? Мы знаем, что прадедушки родились в Трубчевском уезде и всё. Но там было 9 волостей! И они могли родиться в любом селе! Куда двигаться в подобном случае?[/q]
если знаете фамилии и они не распространенные, попробуйте сверху - поиском по соцсетям
|
Тема: Стародубский уезд [Раздел - Брянская обл.] 16.11.2020, 1:14
VitAlex написал:[q] В метрической книге Христорождественской церкви Староминского куреня ЧКВ за 1834 г. встретилась запись о восприемнике - казаке уездного города Стародуба Черниговской губ. Спиридоне Андреевиче Двибровском.[/q]
Возможно один из супругов (скорее - жена) была с ним родственником.
|
|
|