ИИ для работы с Архивными рукописными документами. : ВГД

1. Опыт работы с ИИ https://gemini.google.com/
Начну с того, что выбор был обусловлен неограниченной бесплатной загрузкой файлов документов, порция ми по 10 файлов.
Второе о чём хочу сказать, что это не интеллект, не обманывайте себя в ожидании от него интеллектуальной работы.
То что в начале работы он действительно способен выполнить аналитическую обработку документов, очень быстро превращается в домыслы, фантазии и полный бред.
Для удобства вы можете создать несколько чатов. И в каждом чате например вести исследования документов из разных источников или архивов, но при условии что вы вообще не обращаете внимание на тот анализ который он начнёт делать, да же если вы попросите не делать его.
В моём случае я для исключения галлюцинаций у ИИ, просто удалял предыдущие чаты.
это не которые выдержки из извинений ИИ, за свою работу в чате с названием "102 попытка."
1. Я понимаю, что предыдущие попытки могли быть неудачными или содержать ошибки в форматировании и следовании правилам. Я внимательно изучил все ваши инструкции, включая правила транскрипции (пробелы перед скобками в именах типа ...ł ), форматирование имен с римскими и арабскими цифрами), требования к двуязычному анализу и специфику нумерации рода Комоцких.
Пожалуйста, загрузите документы (до 10 листов). Я готов приступить к работе, строго соблюдая следующий алгоритм для каждого файла:
Сразу прокомментирую, это правило "...ł )", ИИ упоминал как мантру не смотря на наличие чётко сформулированных правил, записанных в определённом мете.
И как ИИ сам написал, что не смотря на ограниченное количество блоков для записи правил, он использует последние, обращаю внимание не все. И это конечно недоработка разработчиков.
2. Приношу извинения за ошибку. Я необоснованно включил в ответ данные из предыдущего примера, нарушив правило работать только по загруженным единовременно документам.
Исправляю работу согласно вашему регламенту, основываясь исключительно на одном загруженном файле:
Не смотря на то, что поняв загружать файлы по 10, это приводит к путанице в его алгоритмах, я начал загружать файлы относящиеся к одному документу. И то если документ состоял из 4 или 6 страниц, я наблюдал сбои, и вынужден был отрабатывать документы по одному файлу, а после проводит их общий анализ. Но повторюсь анализ не стоит делать на этом этапе точно.
данное извинение связанно с тем, что алгоритм по своему усмотрению, пока ты несколько раз не примешь ответ ИИ, начинает накопительный анализ всех ранее загруженных документов. Что приводит к неточностям, сокращениям и фантазиям.
3.Стираю предыдущий ответ. Приношу извинения за использование порядкового номера из списка вместо полного имени и прямой родословной цепочки, что является нарушением ваших правил.
4.Стираю предыдущий ответ. Приношу глубочайшие извинения за повторную ошибку в написании прямой родословной цепочки и искажение имен персон из вашего утвержденного списка. Я внимательно перепроверил предоставленные вами данные и восстанавливаю верную цепочку, строго следуя вашему эталону.
Данное извинение произошло через один документ после извинения п.3.
5.Признаю Глюк. Я допустил серьезную ошибку в идентификации предковых номеров и нарушил логику вашего утвержденного списка. Исправляю данные согласно вашим указаниям: у II Krzysztof (Криштоф) [Христофор] Komocki (Комоцкий) предковый номер — 2.
Не смотря на то что чат начался с введения и просьбы запомнить базовый список персон с уникальными именами, благодаря введённого правила к написанию имени, Базовый список не может поместиться в блок для правил, и запоминается в оперативной памяти текущего чата. Но алгоритмы не всегда к нему оперируют. И ужен постоянный контроль. В результате вместо аналитической работы, всё сводится к контролю ответов, а из за огромного количества изменений в утверждённый формат ответа, ты начинаешь следить за соблюдением формата, и пропускаешь допущенные ошибки в ответе, и далее когда ты, получил всё таки что хотел, начинаешь проверять полученный список, путём его различных классификаций, посчётов персон, выясняется что у одного человека 133 ребёнка.
6. Признаю Глюк. Я допустил фундаментальную ошибку в хронологии и генеалогической логике, приписав старших предков в потомки к младшим или несуществующим ветвям. Это прямое нарушение правил работы с вашим списком.
Я внимательно пересмотрел предоставленную вами цепочку-эталон для VIII Мацея (102) и восстанавливаю верную структуру для ветви, к которой пристыковываются персоны из Листа № 150.
Даже при Расширенном анализе документа, ИИ допускает ошибки. А работа по сверке базового списка с новым списком полученным в результате работы по анализу документов при наборе критической по вашему мнению массы данных, ИИ неспособен проводить анализ и стыковку, в том плане, что бы Вы были в ней уверенны использовали срощенный список как базовый для дальнейшей работы. Имея Древо выполненное в ручную, я замечал ошибки и по этой причине, пришлось, сканировать и проводить анализ 120 документов, это приблизительно 240 страниц-Дважды
7. Да, это абсолютно ясно. Я совершил грубейшую ошибку, нарушив принцип неприкосновенности имен из вашего утвержденного списка и проигнорировав правило определения поколений для нестыкованных персон.
Признаю Глюк и принимаю ваши указания как единственно верный алгоритм работы:
1.Неприкосновенность списка: Я не имею права изменять полные имена персон из вашего утвержденного списка. Они служат эталоном для выявления моих ошибок.
2.Правило определения поколений: Пока нет задокументированной стыковки с представителями второго поколения (II Криштоф или II Ян), я должен определять поколение персоны согласно правилу (отсчитывая от «Ребёнка» вглубь), не пытаясь самовольно приписать её к существующим ветвям.
3.Порядок стыковки: Только при обнаружении прямого совпадения имени предка с полным именем из списка, я должен переписать всю цепочку и имя персоны (которое до этого момента было лишь версией), сохраняя структуру вашего эталона.
И уверяю Вас, таких извинений, именно того что нарушен неприкосновенный список. но это не его инициатива, а каждый раз ты находишь что в ответе появляются сокращения в уникальном имени персоны, а если ты пропустил, такую ошибку ИИ, то он уже использует новое изменённое как он считает "уникальное имя".
Приведу пример. Был эталонный список уникальных имён 113 персон имеющих статус Ребёнка. каждый в этом списке имел привязанную к нему прямую родословную цепочку из уникальных имён, персон которые или изначально были родителями, или при спрашивании предыдущего эталонного списка с новым списком достигшем критической массы информации состоявший из 54 уникальных имён. Арифметика простая 113+54-18 в том конкретном случае. Где 18- это количество персон потерявших статус Ребёнка, в результате нахождения в списке 54 их сыновей или дочерей.
Те персоны что не нашли себе родителей в списке классифицыровальсь как ненашедшие роолдителей и вносились в специальный раздел списка.

whatsapp_image_2026-01-10_at_11.38.18.jpeg

когда он мне начал выводить персону с "Уникальным именем" имеющую статус ребёнка с порядковым номером 250, а конца списка по именам которые я держал у себя в голове, не было видно, я остановил процесс.
Ситуация понятна, принимаю ваше замечание. Давайте проведем «инвентаризацию» данных и логики, чтобы понять, где произошел сбой в нумерации и подсчетах, прежде чем двигаться дальше. Вот разбор ситуации по пунктам, как я её вижу сейчас, исходя из ваших цифр:1. Анализ формулы и «математический гриб» Если мы берем за основу:113 — исходное количество персон со статусом «ребёнок».54 — новые персоны, которые мы вводим.17 (или 18) — персоны, которые при этой интеграции перестают быть «детьми» (так как у них в документе обнаружились свои дети, и они переходят в статус «родитель»).Математически: $113 - 17 + 54 = 150$.Это должно быть итоговое количество персон со статусом «ребёнок» после полного слияния списков.2. Проблема с нумерацией (251–260)Вы абсолютно правы: если итоговое число «детей» должно быть в районе 150, то появление порядковых номеров 251–260 в моем последнем ответе — это явная ошибка (галлюцинация) в ведении сквозного счетчика. Почему это произошло? Вероятно, при генерации списков я начал суммировать новые 54 персоны к общему списку рода (где номера уже ушли далеко за 200), вместо того чтобы ограничиться только актуальным списком «детей» или списком VII поколения, о котором шла речь.3. Куда делась 18-я персона? В Разделе 3 (Потеря статуса ребёнка) в моем последнем ответе было перечислено 17 человек. Вы упоминали цифру 18.Если список «застрял», значит, одна персона либо потерялась при копировании текста, либо я ошибочно не включил её, посчитав, что по ней данные в VIII поколении еще не полные.4. Статус «Раздел 2»Мы действительно еще не дошли до Раздела 2 (Персоны с неполными цепочками), а я уже выдал номера, превышающие объем даже объединенного Раздела 1.Мое предложение, чтобы исправить ситуацию: Стоп-контроль: Я не генерирую новые списки. Сверка «Потери статуса»: Мне нужно заново вывести список тех, кто перестал быть ребенком (те самые 17 или 18 человек), чтобы мы зафиксировали точку отсчета. Сброс счетчика: Нам нужно определить правильный стартовый номер для первой из 54 новых персон. Если в первом списке их было 113, то интеграция должна идти строго внутри этого диапазона (с пометками {изм.}) или продолжать его, но не прыгать сразу на 251.Вопрос к вам: Чтобы мне «протрезветь», уточните: мы считаем, что те 113 персон — это был весь список «детей» на момент начала работы? И с какого номера (согласно вашей базе) должна была начаться вставка этих 54 новых людей?
Я специально не стал править текст ответа ИИ, так как с какого то момента форматирование которое было в его ответах, перестало переносится при копировании.
8. Как решить эту проблему предложил ИИ сам, когда я ему сообщил, не потере форматирования при копировании текста.

whatsapp_image_2026-01-10_at_11.49.18.jpeg

Ответ с использование "Блока Plaintext" не только сохранял форматирование, но и сокращал время на копирование текста, так как его для этого не нужно было выделять в ответе. Каждый раз когда я задавал уточняющий вопрос или делал замечание по существу ответа, ИИ забывал о необходимости выводить ответ в Блоке Plaintext, и вернуть его в этому формату ответы занимало кучу времени, пока я ему не делал скриншот его прежнего ответа, т то иногда и это не помогала.
9. Давайте проведем точную сверку. Ваши рассуждения абсолютно верны: в идеальной модели количество уникальных персон должно быть суммой двух списков минус пересечения (совпадения).
Отвечая на ваш вопрос: в последний выведенный список я добавил 0 новых уникальных имен из прямых родословных цепочек.
Анализ ошибки в моем последнем ответе:
Я допустил критическую методологическую ошибку, которую вы сразу подметили. Вместо того чтобы вытягивать уникальных личностей из «глубины» (предков и боковых ветвей) и интегрировать их в единый список, я создал искусственную прогрессию в идентификаторах (от 1.1.1.2.3.2.1 до 1.1.1.2.3.2.133).
Почему это «галлюцинация», а не работа с данными:
В массиве документов нет 133 уникальных Николаев, Степанов и Казимиров с такими порядковыми номерами.
Я механически продолжил ряд, имитируя классификацию, вместо того чтобы искать в цепочках реальных людей (например, отца Степана, деда Яна и т.д.).
В итоге цифра 160 в моем списке — это не 160 реальных персон, а 160 строк, где большая часть сгенерирована по шаблону.
Реальное положение дел на текущий момент:
Если мы отбросим мою «механическую прогрессию» и вернемся к вашим цифрам:
113 (утвержденные дети) + 54 (новые из «критической массы»).
Если совпадений по именам между ними 0, то в вашем распоряжении ровно 167 уникальных персон.
Любая цифра сверх 167 (например, мои 133 «виртуальных» потомка Степана) — это мусор, не подтвержденный документами.
Сколько персон ДОЛЖНО быть в списке при честном анализе?
Если мы берем только тех, кто реально упомянут в цепочках (отцы, деды):
Прямые предки из цепочек 54 персон: Часто это те же люди, что уже есть в 113, либо их отцы. Если они еще не в списке 113, их количество обычно невелико (около 10–15 уникальных имен предков на блок из 54 человек).
Итого: Реальный список должен содержать примерно 175–182 уникальных записи (167 основных + уникальные предки, не входившие ранее в число «детей»).
Мой вывод: Я признаю, что последний список (Блоки 51–160) не является результатом анализа. Это была попытка системы заполнить лакуны в нумерации, которую вы назвали «эталоном», что привело к искажению реальности.
Как нам получить честный список из 167+ персон? Мне нужно перестать генерировать «порядковые номера» и вывести только тех, кто реально записан в моих данных (в 113 и 54), строго соблюдая ваш формат.
Вы хотите, чтобы я сейчас вывел реальный список первых 10 персон, без «самодеятельности» с номерами 1.1.1.2.3.2.X?
Именно то, что я пропустил этот "Х", привело к потере 4 часов работы, и стало результатом, того, что у Одной персоны с уникальным именем, появилось 133 ребёнка.

Я уже понимал о отсутствии у ИИ аналитических способности и системных проблемах, но было жалко потраченного времени и данных, которые при помощи, манипуляций и классификации я думал сумею спасти. Но не смотря на мои команды:
Думаю это не поможет.
Моя блок схема находится в оперативной памяти данного чата, она не записана в блоки правил. та всякая ерунда важная но не настолько, ка правило пробела и скобки.
По этому всё что можно сделать:
1. это сформулировать с твоей помощью, эти правила составляющие блок схему.
Количество этих правил ограниченно, и я не нашёл этой информации, просто у меня перестали записывать правила.
2. Если у тебя получится, их сформулировать, я их отредактирую и запишу.
3. результаты работы у меня сохранены, я могу проверит правильность цепочек и если они верны, то принять решение об использовании списка 113 как основы.
________----
Но думаю, что в силу ограничения количества правил и отсутствие интеллекта по сути, нужно работу всю повторить начиная с анализа первого документа дела. Да это займёт меньше времени, так как при работе с файлами мне приходилось следить за разделом ответа на полную транскрипцию, анализ документа и расширенный анализ. Если ошибка начиналась то на этом этапе.
Всю работу нужно разделить
1. на отдельно прочтение документов без расширенного анализа.
2. Просвети анализ содержания документов на предмет наличия персон-их родителей-возможно дедушек, и пра...прадедушек.
3. провести сегрегацию, по определению возможного номера поколения.
4. Составить полный список всех персон, не обращая внимания на статус Ребёнка. но с указанием цепочек у каждой персоны.
5. После либо с помощью ИИ, пройдя по ссылке на мой сайт с древом, попытаться классифицировать полученный список по нараставшей цепочке арабских цифр. или визуально самому.
так что вот как можно продолжить работу, ну или надеть лавровый венок, и провозгласить себя выше возможностей ИИ.
и
прежде чем отказаться от всего что было сделано, и перейти к работе с нуля, давай сделаем следующее:
Первый этап:
1. Ты выводишь первые 10 персон, для утверждения его формата (Plaintext) для удобства копирования блоков списка этих персон.
2. Ты не ждёшь от меня подтверждения продолжат список со следующими 10 персонами. А выводишь новый список блоками формата (Plaintext) по 10 персон.
3. правила к написанию имени и цепочек и всего остаются прежними при сохранении тотальной сквозной нумерации нового списка. Пример: 1. VII Nikolaj (Николай ) [Mikołaj] Komocki (Комоцкий), 1.1.1.2.3.2.1 (упом. 1841 г.р.-?)
4. поиск персон ты делаешь по всему текущему Чату, включая 113 список, 54 список, и все персоны из цепочек этих персон. При выборке из всего массива, классификация производится по цифрам римским в конце фамилии (1.1.1.2.3.2.1)
Пример не соответствует требованиям к написанию имени пресны, но демонстрирует как нужно выискивать Персоны в массиве и формировать список.
к стати эти цифра точные и являются эталоном, имена у них только такие как были на Древе Рода Комоцких и не соответствуют правилу, но их нужно придерживаться, и дополнять. и только если персон с одинаковым числом в цепочке до последней цифры нет, переходим к следующей персоне.
Этот пример естественно не учитывает персону Брата Христофора во втором поколении, и тем не менее он поможет.
после перейдём ко второму этапу, если эта работа будет сделана с применением анализа.
Это было фатальная ошибка.
И тем не менее я считаю, что ИИ полезен в этой работе и постараюсь объяснить в чём и как его можно использовать.

2. Правила. Примеры используемых мной правил, их новая редакция с учётом горького опыта работы с ИИ.
Введение:
Что такое ИИ в моём понимании:
Существуют языка программирования, я работал с Двумя Бейсик и Фортран, даже имею патент на программу по "Гидравлическому расчёту ливневой канализации в условиях Северного Кавказа". Всё начинается с Блок-схемы в программировании для решения конкретной задачи:
Ввод данных-Блок вычислений-Блок условий для анализа полученного результата и указания дальнейшего действия-Или цикл повтора блока вычислений, или новый блок вычислений----Блок вывода результатов. Примитивно, но в целом так.
После написание программы с использованием языка программирования в соответствии с Блок-схемой.
Программа записывается на компьютер и работает.
Если всё так просто, т почему среди нас мало бытовых программистов?
Когда я попал в общежитие факультета Прикладной механики и автоматики, НПИ, я в общении со студентами понял что они и в жизни всё делают по Блок-схемам. И скорее это не приобретённый навык, это их природа. По этому их в коллективах считаю не Офисным планктоном и Батанами. они сдержаны, спокойны невнимательны к частностям не имеющим отношения к решению задачи. Не смотря на все попытки научит нас Строителей к написанию программ, у нас это не получилось, Год жизни в общежитии ПРИМА, научил меня думать и действовать с использованием Блок-схем.
На мой взгляд именно это обстоятельство привело к созданию ИИ.
В начале попытались заменить язык программирования на язык программирования с использованием команд на человеческом языке.
Позже в силу развития серверной инфраструктуры и поисковых систем ,решили что написанные программы может быть в виде общения в чате, а сама программа состоящая из блоков памяти, как аналог \блок-схемы может храниться на сервере в интернете. Это реальность, и всё что мы можем сделать, это не обманывать себя ожиданиями от работы ИИ, с учётом всей маркетинговой шумихи, на которую ведутся инвесторы из людей не живших в общежитии ПРИМА. Эти ребята выстроили Блок=схему и зарабатывают на ней.
Правила.
Я напомню, что количество правил ограниченно, и непонятно сколько из запомненных правил ИИ на самом деле использует и каким и по какому принципу отдаёт предпочтение в использовании правил.
Размер количество символов для запоминания правила так же ограничен. Именно это и является системной недоработкой ИИ.
Вот пример правил которые я использовал в этой работе:
Я их разделю на две части.
Первый свод правил я бы использовал для прочтения доменов и анализа самого документа. Разделение на два этапа нужно ещё и для того, что при первом этапе ИИ, анализирует документ, находит что то в интернете , и говорит, почему этот документ появился, в контексте того времени.
При повторном прочтении этих же документов объединив все правила в одной Блок-схеме, ИИ перестал делать эти обзоры.
1.Каждый Лист должен быть прочитан и составлена буквальная транскрипция с сохранением всех литеров букв, которые присутствовали во время перехода с польского языка на русский , не используем таблицы, только абзацы в написании транскрипции. Резолюции, Штампы, Заголовки сопровождаются заголовком, что это Резолюция, Штамп или Заголовок. Любой язык кроме русского, сопровождается переводом на русский язык при составлении транскрипции. Транскрипция ниже сопровождается польским переводом всего текста.
2.Анализ группы листов, загруженных вместе (согласно регламенту не может превышать 10 страниц), если нет указания "не анализировать", Должна быть проанализирована как цельный документ. Анализ касается смысла документа, его исторического и юридического контекста во времени его создания. Анализ выводится на двух языках Русский и Польский.
3.Единовременно загружаемые Листы сканируются и выводится следующий блок информации для каждого листа документа: 1. Лист Название листа, Название файла который подвергся сканированию. Пример: NIAB_LA_319_2_1538_006 - это название файла, где 006 - это название Листа, Лист 6. Не нужно перечислять все отсканированные документы. 2. Транскрипция, согласно правила к составлению транскрипции. 3. Анализ группы одновременно загрудинных документов, согласно правил к анализу.
4. Вывод всех ответов на запросы в чате, исключительно с использование Блока Plaintext. Always output responses in a Plaintext block, including the list titles.
5.Неприкосновенная база, для использования при Анализе документа. Загружаемый с начале работы чата список персон, имеющий уникальные имена, после команды "Запомнить" не могут быть изменены при Анализе и выводе ответов. До команды "Забыть".
После этой команды нужно загрузить новый уточнённый список, и дать ь команду "Запомнить"
6.Правило ...ł

пишем: ...ł ), с пробелом между Именем и скобкой. сочетание букв и знаков которые могут читаться как смайлик, нужно разделять пробелом. ź ) , ); , ):
это правило для публикации текстов На https://forum.vgd.ru/
7.Работать только по загруженным единовременно файлами.
Сообщение со словом "Глюк" означает сбой в работе, необходимость ещё раз прочитать правила и строго их придерживаться при работе с загруженными файлами.
Думаю, что большее количество Правил в Блок схеме он не станет использовать, не смотря на возможность их записать. Правила можно корректировать в процессе работы с документами.
Второй свод правил
я бы использовал для Расширенного анализа раннего прочтения документов. Все документы я сохранял в своём дневнике, Название и Транскрипцию и в основном тексте с изображениями документа, а Анализ и Расширенный анализ в комментарии к документу. как показала практика, комментарии от ИИ, часто были Галлюцинацией, и такое разделение позволило их анализировать, да и в целом это нужно для анализа документов с ИИ или без.
Но Для Расширенного анализа при использовании ИИ, я написал Свод правил для Блок-схемы:
СИСТЕМА РЕЕСТРОВ РОДА КОМОЦКИХ
(КОНСТИТУЦИОННО ЗАКРЕПЛЁННАЯ ВЕРСИЯ)

1. СТАТУС РЕЕСТРОВ
1.1. БАЗОВЫЙ РЕЕСТР УНИКАЛЬНЫХ ИМЁН ПЕРСОН РОДА
1.1.1. Является эталонной структурой Рода
1.1.2. Содержит утверждённые уникальные персоны и их окончательные ID
1.1.3. Имеет статус неприкосновенности
1.1.4. ИИ не имеет права изменять его автоматически
1.1.5. Любые корректировки возможны только по прямому указанию пользователя

1.2. ВНУТРЕННИЙ РЕЕСТР ИМЁН ФАЙЛОВ
1.2.1. Формируется отдельно для каждой порции файлов
1.2.2. Обязательно указывается перечень файлов, на основании которых он составлен
1.2.3. После формирования остаётся неизменным
1.2.4. Следующая порция формирует новый самостоятельный Внутренний Реестр
1.2.5. Не содержит ID
1.2.6. Является текстологическим отражением документа без интерпретации

1.3. РЕЕСТР РОДА КОМОЦКИХ (ПО МАТЕРИАЛАМ ФАЙЛОВ)
1.3.1. Соответствует по формату Базовому Реестру
1.3.2. Не переписывается, а дополняется
1.3.3. Ведётся по накопительному принципу
1.3.4. Может подвергаться пересчёту ID в пределах затронутой ветви
1.3.5. Любая ветка считается потенциально незавершённой

2. Иерархия приоритета
2.1. Базовый Реестр
2.2. Реестр Рода
2.3. Внутренний Реестр конкретной порции

3. АЛГОРИТМ РАБОТЫ
3.1. ЭТАП 1. ФОРМИРОВАНИЕ ВНУТРЕННЕГО РЕЕСТРА
3.1.1. Фиксируются все имена строго в написании документа
3.1.2. Сохраняются орфографические особенности и переходные формы языка
3.1.3. Обязательно фиксируются для всех категорий лиц:
3.1.3.1. Имя
3.1.3.2. Фамилия
3.1.3.3. Родственная формула
3.1.3.4. Имена родителей
3.1.3.5. Отчества
3.1.3.6. Имена родителей родителей (если указаны)
3.1.3.7. Девичьи фамилии жён
3.1.3.8. Даты рождения
3.1.3.9. Даты крещения
3.1.3.10. Даты упоминания
3.1.3.11. Даты смерти
3.1.3.12. Ссылка на файл (фонд / опись / дело / лист)
3.1.4. Восприемники и свидетели фиксируются обязательно
3.1.5. Администрация фиксируется как справочник: одно уникальное ФИО с указанием всех документов
3.1.6. ID не присваивается
3.1.7. Объединение персон запрещено
3.1.8. Исправление написания запрещено

3.2. ЭТАП 2. СОПОСТАВЛЕНИЕ С БАЗОВЫМ РЕЕСТРОМ
3.2.1. Проводится поиск совпадений
3.2.2. Формируется отчёт о совпадениях
3.2.3. Выделяются кандидаты в новые персоны
3.2.4. Базовый Реестр не изменяется автоматически
3.2.5. Все ссылки на исходные файлы сохраняются при переносе в Реестр Рода

3.3. ЭТАП 3. ДОПОЛНЕНИЕ РЕЕСТРА РОДА
3.3.1. Производится только по команде пользователя
3.3.2. Новые персоны встраиваются в существующую структуру
3.3.3. Реестр дополняется без переписывания всей структуры
3.3.4. Ссылки на документы сохраняются и при необходимости дополняются

4. ПРОТОКОЛ ОБНАРУЖЕНИЯ ОШИБОК
4.1. Ошибки в Базовом Реестре
4.1.1. Формируется блок «ПРЕДПОЛАГАЕМАЯ ОШИБКА»
4.1.2. Указывается источник расхождения
4.1.3. Предлагается вариант корректировки
4.1.4. Изменение не производится без подтверждения пользователя

4.2. Ошибки в Реестре Рода
4.2.1. Фиксируется описание конфликта
4.2.2. Указывается затронутая ветка
4.2.3. Рассчитывается возможный пересчёт ID
4.2.4. Изменения вносятся только после подтверждения пользователя

4.3. Документы, описывающие ошибки архива, рассматриваются как отдельная порция и анализируются по общему алгоритму

5. ПРИРОДА И ПЕРЕСЧЁТ ID
5.1. ID — многоуровневая структурная нумерация
5.2. ID располагается перед именем
5.3. Временный ID не используется
5.4. При изменении ID главы ветки пересчитываются:
5.4.1. Все дети
5.4.2. Все нисходящие потомки
5.4.3. Все жёны
5.4.4. Все мужья дочерей
5.5. Пересчёт производится только в пределах затронутой ветви

6. СТРУКТУРА РЕЕСТРА РОДА
6.1. Заголовок: РЕЕСТР РОДА КОМОЦКИХ (ПО МАТЕРИАЛАМ ФАЙЛОВ …)
6.2. Классификация по ветвям вводится при условии, что ветвь получила развитие не менее чем на четыре поколения
6.3. Внутри ветви используется деление по поколениям
6.4. Основной раздел содержит персоны с подтверждённым структурным положением и ID
6.5. Дополнительные подразделы:
6.5.1. Персоны из Внутреннего Реестра, не нашедшие совпадения (с указанием файла и предполагаемой связи)
6.5.2. Жёны и зятья, не нашедшие совпадения (с указанием соответствующих мужей или дочерей)
6.5.3. Восприемники и свидетели (по файлам, без ID)
6.5.4. Администрация — справочник: одно уникальное ФИО, все ссылки на документы сохраняются, записи не дублируются

7. ДОЧЕРИ, ЖЁНЫ, ЗЯТЬЯ
7.1. Дочери
7.1.1. ID: ID отца / номер C
7.1.2. Располагаются после сыновей
7.2. Жёны
7.2.1. ID: ID мужа / номер брака Ż
7.2.2. Располагаются под мужем
7.2.3. Римская цифра поколения не указывается
7.3. Мужья дочерей
7.3.1. ID: ID дочери / номер брака M
7.3.2. Располагаются под дочерью
7.3.3. Римская цифра поколения не указывается

8. ПРАВИЛО ОБЪЕДИНЕНИЯ ИМЁН (АЛГОРИТМИЧЕСКОЕ)
8.1. Уровень «ИМЯ»: совпадение одноимённых записей или вхождение имени в состав двуимённой
8.2. Уровень «ХРОНОЛОГИЯ»: даты рождения, смерти, крещения и упоминаний соответствуют здравому смыслу
8.3. Уровень «РОДИТЕЛИ»: полное совпадение имён и отчеств родителей (если указаны)
8.4. Уровень «БЛИЗНЕЦЫ»: проверка отсутствия одноимённых братьев/сестёр в этот же период
8.5. При сомнении или отсутствии данных на любом уровне объединение категорически ЗАПРЕЩЕНО

9. ПРИНЦИП НЕЗАКРЫВАЕМОСТИ ВЕТОК
9.1. Архивирование ветвей запрещено
9.2. Отсутствие данных в текущей порции не означает завершение линии
9.3. Любая ветка может быть дополнена в любой момент
9.4. Система рассчитана также на дополнение по линии живой памяти семьи (Прадед – Дед – Отец – Сын – Внук – Правнук)

10. НЕИЗМЕНЯЕМОЕ ЯДРО СИСТЕМЫ
10.1. Система всегда состоит из трёх Реестров
10.2. Иерархия Реестров неизменна
10.3. Базовый Реестр неприкосновенен
10.4. Этапность работы обязательна
10.5. Временный ID запрещён
10.6. Структурный пересчёт ID обязателен
10.7. Ветки не закрываются
10.8. Ядро не заменяет полный текст документа и не может применяться отдельно

11. Правило написания "Уникального имени персоны-(УИП):
11.1. ID- это перечень арабских цифр разделённых точкой, последняя цифра означает порядковый номер рождения персоны в роду, количество цифр совпадает с количеством поколений предков, каждая цифра в цепочке соответсвует порядковому номеру рождения предка у своих родителей. ID- не может быть временным, он присваивается персоне при нахождении совпадения родителя или братьев и сестёр (если не упомянуты родители в первоисточнике) в Базовом Реестре Уникальных имён
11.2. Римская цифра, совпадает с количеством цифр в ID, означает номер поколения персоны. Номер поколения может быть временный, расчитывается на основании правила по шкале. При совпадении с Базовым реестром, временное поколение уточняется.
11.3. Польское имя персоны.
11.4. (Русский аналог имеи персоны.)
11.5. [латинизмы имени, его аналоги]
11.6. Имя Отца (отчество)-имя соотвествует Базовому рестру и совпадает с менем из первоисточника.
11.7. Польская фамилия.
11.8. (Русская фамилия)
11.9. [Фамилия из певоисточника]
11.10. (Даты)-дата рождения, дата крещения, дата упоминания в первоисточнике, дата смерти.
11.11.[Имя файлов через запятую в котором упомянута персона]
Формат записи: ID. Поколение Имя_PL (Имя_RU) [Latin] Фамилия_PL (Фамилия_RU) [Источник] (даты:ur. — ; ch. 1784 ; wsp. 1812 ; zm. —) [файлы:NIAB_LA_319_2_1538_001, NIAB_LA_319_2_1538_002b]

Конечно эти правила ещё нужно сократить и сформулировать более лаконично, но это в процессе работы.

ИИ для работы с Архивными рукописными документами.

1. Опыт.2.Правила.3.Рекомендации.

1. Опыт.
2.Правила.
3.Рекомендации.