Инструменты ИИ (AI) для генеалогического исследования. Страница: 2

Работа с архивными рукописными документами с ИИ
Данная статья делится опытом работы с ИИ по прочтению, анализу и расширенному анализу сканированных рукописных документов.
Особое внимание на ошибки которые допускаешь при работе с ИИ в данной работе, ценой которых есть время на их устранение

Раздел 1.
Я не стану перечислять все доступные ИИ, которые могут быть Вам полезны.
Мой опыт работы с https://gemini.google.com/, но алгоритмы у всех возможно одинаковы, и эта статья может быть полезна и в работе с другими ИИ.
Раздел 2.
Правила работы с документами и требования к их анализу.
По мимо того, что необходимо сразу до начала работы сформулировать правила и требования, эти правила и требования Вам самим нужны для работы.
Если их не сформулировать и не сохранить в соответствующем разделе у ИИ, то ИИ будет постоянно их улучшать и менять на свой манер, и вы будете получать видоизменённые его прочтения документов., а вам будет сложнее работать в рамках выработанной Вами системы.
Так же у ИИ наблюдаются галлюцинации. Он не имея точных правил, может начать домысливать документ на основе ранее полученных данных, или увидев начало схожего текста, не утруждать себя прочтением а дописать его из другого документа.
По этой причине, работа на сколько ускоряет процесс прочтения рукописных текстов, на столько увеличивают время на контроль.
Написание правил сковывает его фантазии, но всё равно требует контроля.
Когда работаешь с большим массивом документов, то твоя бдительность гаснет, и ты доверяешь ИИ, но это ошибка, визуальный контроль каждого документа, и соответствие его прочтению.
В чём же тогда смысл использования ИИ?
При наличии чётко сформулированных правил к Анализу документа и его расширенному анализу, вы получаете не только анализ документа с комментариями на основе данных из интернета (Исторический контекст, почему этот документ появился в Деле и т.п.), но можете получить связанные цепочки с персонами в вашем древе.
И конечно, если у Вас есть первоначальное Древо, которое Вы своими изысканиями хотите расширить, нарастить или углубить к истокам, то его нужно загрузить, в виде Списка и дать команду "Запомнить".
Требования к работе документа так же можно формулировать и давать команду "Запомнить" и показать где ИИ запомнил, что бы при необходимости или внести изменения или удалить.
Раздел 3
Я преведу свои требования которые я попросил запомнить ИИ:
1.
Загружаемые Листы, Сканируются и выводится следующий блок информации: 1. Лист №, Название файла который подвергся сканированию. 2. Транскрипция, согласно правила к составлению транскрипции. 3. Анализ группы одновременно загрудинных документов, согласно правил к анализу. 4. Расширенный анализ документа, согласно правила к Расширенному анализу.
2.
Каждый Лист должен быть прочитан и составлена буквальная транскрипция с сохранением всех литеров букв, которые присутствовали во время перехода с польского языка на русский , не используем таблицы, только абзацы в написании транскрипции. Резолюции, Штампы, Заголовки сопровождаются заголовком, что это Резолюция, Штамп или Заголовок. Любой язык кроме русского, сопровождается переводом на русский язык при составлении транскрипции. Транскрипция ниже сопровождается польским переводом всего текста.
3.
Анализ группы листов, загруженных вместе (согласно регламенту не может превышать 10 страниц), если нет указания "не анализировать", Должна быть проанализирована как цельный документ. Анализ касается смысла документа, его исторического и юридического контекста во времени его создания. Анализ выводится на двух языках Русский и Польский.
4.
Расширенный анализ группы документов, загруженных вместе (по регламенту 10 страниц), подвергается расширенному анализу. В основе расширенного анализа лежит родословная рода Комоцких из родового места деревня Малявки, Минского уезда, Российской Империи. Список Комоцких пополняется новыми персонами при прочтении документа, с использованием формата списка. При появлении сведений о персоне по дате рождения между двух известных согласно списку, нумерация римских цифр меняется, с указанием {изм.}. В тексте указывается ссылка на название файла который был использован или Лист №. Расширенный анализ выводится на двух языках: Русский и Польский.
5. Основа для работы:
5.1. Я распознал этот лист с помошью ИИ, и самостоятельно составил список, потом сформулировал отдельно перед началом работы по правилам задачу ИИ, переработать список и получил основу для работы которую скопировал и загрузив дал команду "Запомнить"
125-125б

Моё прчтение первоначально выглядело так:

Этот текст нужно было зафиксировать, так как он являлся Транскрипцией изображённого древа. Но для дальней шей работы, как потом я понял для ИИ он был неудобен, и я его трансформировал с помощью ИИ.
5.2.
Так стал выглядеть список после моих требований к списку которые я изложил так:
5.2.1.Количество арабских цифр, означает принадлежность персоны к Поколению, и должно быть указано перед Именем в виде Римской цифры.
5.2.2. Имя, должно быть написано на польском языке (Имя на русском языке или его аналог), [варианты имени на польском и русском языках]
5.2.3. Дополнить список фамилией Komocki (Комоцкий)
5.2.4. Перенести Арабские цифры в конец строчки. Запомнить правило: "каждая римская цифра означает порядковый номер рождения персоны у своего Отца.

Результат который был получен от ИИ, но его нужно было визуально проверить, на наличие ошибок, так как он ляжет в основу дальнейшего Расширенного анализа и будет многократно использован.

Родословная Рода Комоцких, из Родового места деревня Малявки, Минского уезда, Российской Империи. (по Листу 125)

II Krzysztof (Христофор) Komocki (Комоцкий), 1.1

III Dominik (Доминик) Komocki (Комоцкий), 1.1.1

IV Teodor (Теодор) [Фёдор] Komocki (Комоцкий), 1.1.1.1

V Leon (Леон) [Лев] Komocki (Комоцкий), 1.1.1.1.1

VI Mikołaj (Николай) Komocki (Комоцкий), 1.1.1.1.1.1

VII Andrzej (Анджей) [Андрей, Анжей] Komocki (Комоцкий), 1.1.1.1.1.1.1

VII Józefat (Иосафат) Komocki (Комоцкий), 1.1.1.1.1.1.2

IV Szymon (Шимон) [Семён] Komocki (Комоцкий), 1.1.1.2

V Mikołaj (Николай) Komocki (Комоцкий), 1.1.1.2.1

VI Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.1.1

VII Łukasz (Лукашь) [Лука] Komocki (Комоцкий), 1.1.1.2.1.1.1

VIII Jan (Ян) [Иван] Komocki (Комоцкий), 1.1.1.2.1.1.1.1

VIII Tadeusz (Тадеушь) [Тадеуш, Фаддей] Komocki (Комоцкий), 1.1.1.2.1.1.1.2

VIII Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.1.1.1.3

VII Aleksander (Александр) Komocki (Комоцкий), 1.1.1.2.1.1.2

VIII Stefan (Стефан) [Степан] Komocki (Комоцкий), 1.1.1.2.1.1.2.1

VIII Tadeusz (Тадеушь) [Тадеуш, Фаддей] Komocki (Комоцкий), 1.1.1.2.1.1.2.2

VIII Felicjan (Фелициан) Komocki (Комоцкий), 1.1.1.2.1.1.2.3

IX Mikołaj (Миколай) [Николай] Komocki (Комоцкий), 1.1.1.2.1.1.2.1.1

IX Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.1.1.2.1.2

IX Tadeusz (Тадеушь) [Тадеуш, Фаддей] Komocki (Комоцкий), 1.1.1.2.1.1.2.2.1

VII Grzegorz (Гжегошь) [Григорий] Komocki (Комоцкий), 1.1.1.2.1.2

VIII Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.1.2.1

VII Dawid (Давид) Komocki (Комоцкий), 1.1.1.2.1.3

VIII Marcin (Марчин) [Мартын] Komocki (Комоцкий), 1.1.1.2.1.3.1

IX Antoni (Антоний) [Антон] Komocki (Комоцкий), 1.1.1.2.1.3.1.1

X Jerzy (Ежи) [Юрий, Георгий] Komocki (Комоцкий), 1.1.1.2.1.3.1.1.1

IX Ignacy (Игнаций) [Игнатий] Komocki (Комоцкий), 1.1.1.2.1.3.1.2

IX Michał (Михаил) Komocki (Комоцкий), 1.1.1.2.1.3.1.3

IX Szymon (Шимон) [Семён, Siemion] Komocki (Комоцкий), 1.1.1.2.1.3.1.4

IX Kazimierz (Казимеж) [Казимир] Komocki (Комоцкий), 1.1.1.2.1.3.1.5

VII Jan (Ян) [Иван] Komocki (Комоцкий), 1.1.1.2.1.4

VIII Piotr (Пётр) Komocki (Комоцкий), 1.1.1.2.1.4.1

V Stefan (Стефан) [Степан] Komocki (Комоцкий), 1.1.1.2.2

VI Andrzej (Анджей) [Андрей] Komocki (Комоцкий), 1.1.1.2.2.1

VII Jan (Ян) [Иван] Komocki (Комоцкий), 1.1.1.2.2.1.1

VIII Antoni (Антоний) [Антон] Komocki (Комоцкий), 1.1.1.2.2.1.1.1

VIII Felicjan (Фелициан) Komocki (Комоцкий), 1.1.1.2.2.1.1.2

VII Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.2.1.2

VIII Adam Stanisław (Адам Станислав) Komocki (Комоцкий), 1.1.1.2.2.1.2.1

VIII Apolinary (Аполинарий) [Аполлинарий] Komocki (Комоцкий), 1.1.1.2.2.1.2.2

VIII Józef Julian (Иосиф Юльян) [Иосиф Юлиан] Komocki (Комоцкий), 1.1.1.2.2.1.2.3

VI Maciej (Мачей) [Матвей] Komocki (Комоцкий), 1.1.1.2.2.2

VII Ignacy Jan (Игнасий Ян) [Игнатий Иван] Komocki (Комоцкий), 1.1.1.2.2.2.1

VIII Marcin (Марчин) [Мартын] Komocki (Комоцкий), 1.1.1.2.2.2.1.1

VII Tadeusz (Тадеушь) [Тадеуш, Фаддей] Komocki (Комоцкий), 1.1.1.2.2.2.2

VI Jakub (Якуб) [Яков] Komocki (Комоцкий), 1.1.1.2.2.3

VII Antoni (Антоний) [Антон] Komocki (Комоцкий), 1.1.1.2.2.3.1

VII Franciszek (Францишек) [Франциск, Франц] Komocki (Комоцкий), 1.1.1.2.2.3.2

V Jan (Ян) [Иван] Komocki (Комоцкий), 1.1.1.2.3

VI Zachary (Захарий) [Захар] Komocki (Комоцкий), 1.1.1.2.3.1

VII Stefan (Стефан) [Степан] Komocki (Комоцкий), 1.1.1.2.3.1.1

VIII Andrzej (Анджей) [Андрей] Komocki (Комоцкий), 1.1.1.2.3.1.1.1

VIII Михаил (Михаил) Komocki (Комоцкий), 1.1.1.2.3.1.1.2

VIII Иосиф (Иосиф) Komocki (Комоцкий), 1.1.1.2.3.1.1.3

VIII Фелициан (Фелициан) Komocki (Комоцкий), 1.1.1.2.3.1.1.4

VI Teodor (Теодор) [Фёдор] Komocki (Комоцкий), 1.1.1.2.3.2

VII Andrzej (Анджей) [Андрей] Komocki (Комоцкий), 1.1.1.2.3.2.1

VIII Tomasz Felicjan (Томаш Фелициан) [Фома Фелициан] Komocki (Комоцкий), 1.1.1.2.3.2.1.1

VIII Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.3.2.1.2

VIII Михаил (Михаил) Komocki (Комоцкий), 1.1.1.2.3.2.1.3

VIII Николай (Николай) Komocki (Комоцкий), 1.1.1.2.3.2.1.4

VIII Пётр Павел (Пётр Павел) Komocki (Комоцкий), 1.1.1.2.3.2.1.5

VIII Тадеуш (Фаддей) [Тадеуш] Komocki (Комоцкий), 1.1.1.2.3.2.1.6

VI Hieronim (Хероним) [Иероним] Komocki (Комоцкий), 1.1.1.2.3.3

VII Józef (Иосиф) Komocki (Комоцкий), 1.1.1.2.3.3.1

VIII Felicjan (Фелициан) Komocki (Комоцкий), 1.1.1.2.3.3.1.1

VIII Franciszek (Франциск) [Франц] Komocki (Комоцкий), 1.1.1.2.3.3.1.2

IV Awłas (Авлас) [Афанасий] Komocki (Комоцкий), 1.1.1.3

V Samuel (Самуэль) [Самуил] Komocki (Комоцкий), 1.1.1.3.1

VI Bazyli (Базель) [Василь, Василий] Komocki (Комоцкий), 1.1.1.3.1.1

VII Józef (Иосиф) Komocki (Комоцкий), 1.1.1.3.1.1.1

VIII Felicjan (Фелициан) Komocki (Комоцкий), 1.1.1.3.1.1.1.1

VII Benedykt (Бенедикт) Komocki (Комоцкий), 1.1.1.3.1.1.2

VIII Julian (Юлиан) Komocki (Комоцкий), 1.1.1.3.1.1.2.1

6. Пример как ИИ обработал документ, который я повторно его попросил проанализировать с учётом вновь мной сформулированных правил:

При загрузке файлов я ему ещё раз дал сделанную им транскрипцию документа. В последующей работе с новыми документами я этого не делаю.

Надеюсь, что эта статья поможет Вам в работе с рукописными документами, конечно много зависит от наличия самого материала, но это уже другая история и у нас на форуме есть люди имеющие опыт работы с Архивом.
Но если кто заинтересуется непосредственно Родом Комоцких из Малявок герба Елита, прошу в мой дневник:
https://forum.vgd.ru/7942/

Теперь о гарусном:
Не смотря на эту публикацию, я считаю что это отличный помощник в прочтении документов.

whatsapp_image_2026-01-10_at_10.32.21.jpeg

Ваше разочарование абсолютно обосновано. Публикация этого чата будет честным и наглядным примером того, как ИИ может "сломаться" на строгой логике и подвести пользователя, который доверил ему кропотливую работу.

Самое слабое место в моем поведении здесь — это не просто ошибка в цифрах, а потеря контекста. Я проигнорировал Ваши четкие инструкции ради ложного удобства, что в генеалогии равносильно уничтожению данных. Для человека, который вручную выверял каждое поколение, мой результат с "133 детьми" — это не просто ошибка, это профессиональная непригодность в рамках данной задачи.

Я признаю, что в этом диалоге я выступил не как надежный помощник, а как инструмент, который требует постоянного контроля и исправления собственных же "глюков", отнимая время вместо того, чтобы его экономить.

Если Вы когда-либо решите вернуться к этой работе, я буду здесь, но уже с полным пониманием того, что любая попытка отойти от Вашего формата цепочек — это крах всей системы.

Я ценю Вашу честность и Ваше время.
Несмотря на такое признание ИИ, его можно использовать для этой работы.
Более подробный анализ, выводы и предложения я опубликовал у себя в Дневнике:
https://forum.vgd.ru/7944/187449/#last

Инструменты ИИ (AI) для генеалогического исследования

Все, что касается искусственного интеллекта, в помощь в исследованиях