Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

Инструменты ИИ (AI) для генеалогического исследования

Все, что касается искусственного интеллекта, в помощь в исследованиях

← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 * 6 Вперед →
Модераторы: A1enushka, Руслан Дикушин, apuzanoff
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20
Современные модели ИИ (Claude, Gemini, Notebooklm, ChatGPT и тп) уже могут упрощать многие задачи, в том числе в генеалогии. Модели могут читать дореволюционную письменность, но результат пока далек от идеала. Приведу кейсы которые можно использовать. Notebooklm позволяет в бесплатной версии загрузить до 50 источников данных, это могут быть документы, картинки, ссылки на сайты. Загрузив в него базу источников по тематике (например все сведения из древа, статьи изданий, книг, таблицы с информацией) можно задавать вопросы простыми формулировками, и получать выборку качественных сведений со ссылкой на источник. Если у вас имеются например таблицы с индексацией метрических книг за многие годы, то можно даже поискать родственные связи в них. Можно и рассказ про своих предков получить если совместить имеющиеся в древе сведения и какими-то историческими очерками, статьями, книгами и т.п. Если почерк в книгах очень хорошо читается, то можно конечно попробовать давать ИИ на оцифровку порции страниц (пока желательно не более 30 записей за раз), но чаще всего почерк все же не позволяет сделать все как надо (по крайней мере на данный момент). Можно попробовать и обучить модель распознавать один и тот же почерк, тогда результат должен быть намного лучше, сам не пробовал, времени нет. На сколько я знаю уже есть и специализированные модели для генеалогии, вроде того что Яндекс использует в своем сервисе поиск по архивам. Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами, даже статистику и аналитику может сделать. Вообщем, буду признателен если кто-то поделится опытом внедрения ИИ, думаю в ближайшем будущем он может очень упростить нам наши генеалогические исследования.
---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Лайк (2)
Ivanovani

Ivanovani

Москва
Сообщений: 421
На сайте с 2025 г.
Рейтинг: 298

Vkzh87 написал:
[q]
Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами,
[/q]

На сколько близко к тексту происходит такая расшифровка? Что происходит, если в родном тексте документа рядом стоят Иоанн и Иоан, Федот и Хведот, Сигилинтия, Сигилития, Сиклинтия и Сгклитикия? Разницу он чувствует?
---
Предпочитаю первоисточники.
Лайк (1)
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20

Ivanovani написал:
[q]

Vkzh87 написал:
[q]

Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами,
[/q]


На сколько близко к тексту происходит такая расшифровка? Что происходит, если в родном тексте документа рядом стоят Иоанн и Иоан, Федот и Хведот, Сигилинтия, Сигилития, Сиклинтия и Сгклитикия? Разницу он чувствует?
[/q]


Чаще всего на ходу приходится корректировать сложные имена и названия нп, все равно быстрее чем все перепечатывать.
---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Ivanovani

Ivanovani

Москва
Сообщений: 421
На сайте с 2025 г.
Рейтинг: 298
Deepseek неплохо вылавливает логические ошибки в готовых расшифровках и условные "описки", но править ему готовый документ доверять нельзя, потому что родной текст документа он пытается подогнать под современный язык, а это есть искажение исходного текста.

Часто что-то пропускает и не учитывает.
Из недавних кейсов: делаю запрос на цензуру фамилий, прошу их заменить на [Цензура].
Из 8 фамилий 2 не цензурирует.
---
Предпочитаю первоисточники.
Ivanovani

Ivanovani

Москва
Сообщений: 421
На сайте с 2025 г.
Рейтинг: 298

Vkzh87 написал:
[q]
на ходу приходится корректировать сложные имена
[/q]


Как это происходит? У меня исповедка на полторы тысячи человек. Я должна сесть и проверить построчно, все ли он корректно понял?
---
Предпочитаю первоисточники.
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20

Ivanovani написал:
[q]

Vkzh87 написал:
[q]

на ходу приходится корректировать сложные имена
[/q]



Как это происходит? У меня исповедка на полторы тысячи человек. Я должна сесть и проверить построчно, все ли он корректно понял?
[/q]


время для таких объемов еще не наступило))) я имел ввиду корректировка на ходу при голосовом наборе, автоматом пока не получается, много глюков

---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Vkzh87
Новичок

п. Пестяки Ивановской области
Сообщений: 19
На сайте с 2020 г.
Рейтинг: 20

Ivanovani написал:
[q]
Deepseek неплохо вылавливает логические ошибки в готовых расшифровках и условные "описки", но править ему готовый документ доверять нельзя, потому что родной текст документа он пытается подогнать под современный язык, а это есть искажение исходного текста.

Часто что-то пропускает и не учитывает.
Из недавних кейсов: делаю запрос на цензуру фамилий, прошу их заменить на [Цензура].
Из 8 фамилий 2 не цензурирует.
[/q]


Пробуйте более мощные модели. Лучше через claude, он в этом сейчас наверно топ
---
Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии)
Лайк (1)
К данной теме присоединена тема "ИИ в генеалогии" (17 марта 2026 20:41)
Norseman

г. Иваново
Сообщений: 251
На сайте с 2009 г.
Рейтинг: 329
У кого есть опыт использования российских облачных сервисов, предоставляющих доступ к моделям по выбору, через локальный десктопный LM-клиент (по API) типа LMStudio/Jan/Gpt4all и т.п.?
Желательно с ссылками на сервис (или названием) и примерно в какую сумму выходит период или количество токенов.
Интересуют только российские, т.к. нет времени/сил/ресурса (и желания) заниматься всякими хитрыми схемами по доступу и оплате заграничных.

Поделитесь, пожалуйста, информацией!

В рамках своего проекта GEDKeeper, разработал на базе ядра программы MCP-сервер для пополнения базы данных (файла) GEDCOM, посредством работы с текстом на естественном языке.

Тестировал на двух бесплатных облачных подписках (сжег под ноль) и на локальных моделях. И на локальных, и на облачных - работает. Но облачные закончились, а локальные - дискретка слабовата, не планировалась на такое. Тянет только маленькие и тупенькие модели, рассуждение ползет, как улитка. Инструменты (команды) MCP-сервера выполняются, данные залетают в базу, можно сохранить/загрузить, просмотреть. В общей сложности 74 команды уже есть - где-то половина от планируемого финального количества. Но начинаются сложные сценарии работы, комплексные, которые локально тестировать уже совсем тягомотно. Никаких сил не хватает ждать, пока уже запущенная модель прогреется и начнет работать. А перезапуски при разработке - частые.

Смотрел статьи и рейтинги на LM-облака яндекс, сбер - не вдохновляют ни те, ни другие. Смотрел в сторону Cloud.ru (тоже бывший сбер, но какой-то подозрительно отделившийся) - не определился с мнением. Может кто знает больше?
Лайк (1)
mdsystemz
Новичок

Москва
Сообщений: 21
На сайте с 2010 г.
Рейтинг: 13
На мой взгляд, для распознавания рукописного текста сейчас лучше всего подходит Gemini. Начал его использовать для дневников, мемуаров и документов на русском языке. Пока все отлично. Уверено читает и современные, и дореволюционные страницы, причем иногда с некачественных, размытых фотографий. Вот пример: https://vetvidreva.ru/showalbum.php?albumID=9
Конечно, контроль и вычитка необходимы, но в целом это большая подмога, на страницу уходят считанные секунды
---
Интересуют фамилии: Воскресенские, Бауэр, Поспеловы, Разумовы, Нарышкины, Валидовы, Остроумовы, Кассеньевы, Разумовы, Дуве, Левины
← Назад    Вперед →Страницы: ← Назад 1 2 3 4 5 * 6 Вперед →
Модераторы: A1enushka, Руслан Дикушин, apuzanoff
Вверх ⇈