Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

ИИ в генеалогии

Делимся опытом кто как применяет ИИ в генеалогии.

← Назад    Вперед →Модераторы: A1enushka, Руслан Дикушин, apuzanoff
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20
Современные модели ИИ (Claude, Gemini, Notebooklm, ChatGPT и тп) уже могут упрощать многие задачи, в том числе в генеалогии. Модели могут читать дореволюционную письменность, но результат пока далек от идеала. Приведу кейсы которые можно использовать. Notebooklm позволяет в бесплатной версии загрузить до 50 источников данных, это могут быть документы, картинки, ссылки на сайты. Загрузив в него базу источников по тематике (например все сведения из древа, статьи изданий, книг, таблицы с информацией) можно задавать вопросы простыми формулировками, и получать выборку качественных сведений со ссылкой на источник. Если у вас имеются например таблицы с индексацией метрических книг за многие годы, то можно даже поискать родственные связи в них. Можно и рассказ про своих предков получить если совместить имеющиеся в древе сведения и какими-то историческими очерками, статьями, книгами и т.п. Если почерк в книгах очень хорошо читается, то можно конечно попробовать давать ИИ на оцифровку порции страниц (пока желательно не более 30 записей за раз), но чаще всего почерк все же не позволяет сделать все как надо (по крайней мере на данный момент). Можно попробовать и обучить модель распознавать один и тот же почерк, тогда результат должен быть намного лучше, сам не пробовал, времени нет. На сколько я знаю уже есть и специализированные модели для генеалогии, вроде того что Яндекс использует в своем сервисе поиск по архивам. Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами, даже статистику и аналитику может сделать. Вообщем, буду признателен если кто-то поделится опытом внедрения ИИ, думаю в ближайшем будущем он может очень упростить нам наши генеалогические исследования.
---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Ivanovani

Ivanovani

Москва
Сообщений: 291
На сайте с 2025 г.
Рейтинг: 154

Vkzh87 написал:
[q]
Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами,
[/q]

На сколько близко к тексту происходит такая расшифровка? Что происходит, если в родном тексте документа рядом стоят Иоанн и Иоан, Федот и Хведот, Сигилинтия, Сигилития, Сиклинтия и Сгклитикия? Разницу он чувствует?
---
Предпочитаю первоисточники
Лайк (1)
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20

Ivanovani написал:
[q]

Vkzh87 написал:
[q]

Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами,
[/q]


На сколько близко к тексту происходит такая расшифровка? Что происходит, если в родном тексте документа рядом стоят Иоанн и Иоан, Федот и Хведот, Сигилинтия, Сигилития, Сиклинтия и Сгклитикия? Разницу он чувствует?
[/q]


Чаще всего на ходу приходится корректировать сложные имена и названия нп, все равно быстрее чем все перепечатывать.
---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Ivanovani

Ivanovani

Москва
Сообщений: 291
На сайте с 2025 г.
Рейтинг: 154
Deepseek неплохо вылавливает логические ошибки в готовых расшифровках и условные "описки", но править ему готовый документ доверять нельзя, потому что родной текст документа он пытается подогнать под современный язык, а это есть искажение исходного текста.

Часто что-то пропускает и не учитывает.
Из недавних кейсов: делаю запрос на цензуру фамилий, прошу их заменить на [Цензура].
Из 8 фамилий 2 не цензурирует.
---
Предпочитаю первоисточники
Ivanovani

Ivanovani

Москва
Сообщений: 291
На сайте с 2025 г.
Рейтинг: 154

Vkzh87 написал:
[q]
на ходу приходится корректировать сложные имена
[/q]


Как это происходит? У меня исповедка на полторы тысячи человек. Я должна сесть и проверить построчно, все ли он корректно понял?
---
Предпочитаю первоисточники
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20

Ivanovani написал:
[q]

Vkzh87 написал:
[q]

на ходу приходится корректировать сложные имена
[/q]



Как это происходит? У меня исповедка на полторы тысячи человек. Я должна сесть и проверить построчно, все ли он корректно понял?
[/q]


время для таких объемов еще не наступило))) я имел ввиду корректировка на ходу при голосовом наборе, автоматом пока не получается, много глюков

---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20

Ivanovani написал:
[q]
Deepseek неплохо вылавливает логические ошибки в готовых расшифровках и условные "описки", но править ему готовый документ доверять нельзя, потому что родной текст документа он пытается подогнать под современный язык, а это есть искажение исходного текста.

Часто что-то пропускает и не учитывает.
Из недавних кейсов: делаю запрос на цензуру фамилий, прошу их заменить на [Цензура].
Из 8 фамилий 2 не цензурирует.
[/q]


Пробуйте более мощные модели. Лучше через claude, он в этом сейчас наверно топ
---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Лайк (1)
← Назад    Вперед →Модераторы: A1enushka, Руслан Дикушин, apuzanoff
Вверх ⇈