Инструменты ИИ (AI) для генеалогического исследования
Все, что касается искусственного интеллекта, в помощь в исследованиях
| Maximovy Москва Сообщений: 465 На сайте с 2017 г. Рейтинг: 449
| Друзья, на тему ИИ в генеалогии сейчас проходит онлайн-коворкинг #моИИсторИИ в "Клубе генеаголиков" в телеграм.
Темы (1 день-1 тема).
1. Расшифровка аудиофайла в текст, голосовой ввод для индексации документов На входе: аудиофайлы
2. Реставрация фотографий (устранение дефектов изображений и улучшение качества, увеличение) На входе: фотография с заломами, почеркушками, пятнами, оторванными углами
3. Игры с фотографиями. Омоложение человека, один ли это человек, оживление фото На входе: любая фотография
4. Улучшение изображений текста (повышение читаемости), удаление водяных знаков, удаление и вырезание штампов На входе: скан документа, скан открытки
5. Распознавание и перевод рукописного текста (изображение в текст) На входе: скан документа
6. Художественная биография по скупому тексту, таблице или нескольким фактам На входе: в текстовом виде – факты биографии, расшифровки архивных документов, личные комментарии
7. Поиск новой информации и литературы На входе: известная информация о человеке или событии
8. Письмо, на которое ответит незнакомый дальний родственник На входе: ссылка на профиль родственника в соцсети, что известно об общем родственнике, что хочешь от человека
9. Анализ данных из таблиц, экспорт данных в таблицы Обсудим какие таблицы нам доступны. Какие темы из #проектG20 мы можем сделать с помощью ИИ, откуда и как взять данные? Например, можем ли сделать выборки картин, нарисованных в нашем уезде? Списки историков, работавших по этому региону с ссылками на места хранения их личных фондов? Списки дневников и мемуаров по региону? К каким источникам мы можем легко сделать именные и географические указатели? На входе: идеи что хотим превратить в таблицы и базы данных, и пожелания, что хотим вытащить из таблиц, которые у нас есть.
10. Создание временных шкал, инфографики, деревьев, иллюстраций На входе: таблица или текст
11. (резерв) #проектG20 Написать руководство по генеалогическому поиску по своему региону или по работе в региональном архиве На входе: архив регионального чата, ветки VGD, материалы с сайта регионального архива, сборники региональных генеалогических и архивных конференций и др.
12. (резерв) Написать план исследования и тексты запросов На входе: известная информация о человеке или событии
Присоединиться можно в любой момент, хоть на одну тему, это бесплатно.
Уже обсудили множество ИИ и приложений. --- Клуб генеаголиков https://t.me/Geneaholic
Все архивы России (описи, справочники) https://ridero.ru/books/nauchno-spravochnyi_apparat_arkhivov_rossii/
Справочники по Звенигородскому и Подольскому уездам Московской губернии>> http://www.maximovy.ru | | |
| Эта тема была выделена из темы "Работа с архивными рукописными документами с ИИ " (7 января 2026 11:56)
|
| Vkzh87 Новичок
п. Пестяки Ивановской области Сообщений: 19 На сайте с 2020 г. Рейтинг: 20 | Современные модели ИИ (Claude, Gemini, Notebooklm, ChatGPT и тп) уже могут упрощать многие задачи, в том числе в генеалогии. Модели могут читать дореволюционную письменность, но результат пока далек от идеала. Приведу кейсы которые можно использовать. Notebooklm позволяет в бесплатной версии загрузить до 50 источников данных, это могут быть документы, картинки, ссылки на сайты. Загрузив в него базу источников по тематике (например все сведения из древа, статьи изданий, книг, таблицы с информацией) можно задавать вопросы простыми формулировками, и получать выборку качественных сведений со ссылкой на источник. Если у вас имеются например таблицы с индексацией метрических книг за многие годы, то можно даже поискать родственные связи в них. Можно и рассказ про своих предков получить если совместить имеющиеся в древе сведения и какими-то историческими очерками, статьями, книгами и т.п. Если почерк в книгах очень хорошо читается, то можно конечно попробовать давать ИИ на оцифровку порции страниц (пока желательно не более 30 записей за раз), но чаще всего почерк все же не позволяет сделать все как надо (по крайней мере на данный момент). Можно попробовать и обучить модель распознавать один и тот же почерк, тогда результат должен быть намного лучше, сам не пробовал, времени нет. На сколько я знаю уже есть и специализированные модели для генеалогии, вроде того что Яндекс использует в своем сервисе поиск по архивам. Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами, даже статистику и аналитику может сделать. Вообщем, буду признателен если кто-то поделится опытом внедрения ИИ, думаю в ближайшем будущем он может очень упростить нам наши генеалогические исследования. --- Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии) | | Лайк (1) |
Ivanovani Москва Сообщений: 323 На сайте с 2025 г. Рейтинг: 181 | Наверх ##
7 марта 23:50 7 марта 23:53 Vkzh87 написал: [q] Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами,[/q]
На сколько близко к тексту происходит такая расшифровка? Что происходит, если в родном тексте документа рядом стоят Иоанн и Иоан, Федот и Хведот, Сигилинтия, Сигилития, Сиклинтия и Сгклитикия? Разницу он чувствует? --- Предпочитаю первоисточники | | Лайк (1) |
| Vkzh87 Новичок
п. Пестяки Ивановской области Сообщений: 19 На сайте с 2020 г. Рейтинг: 20 | Ivanovani написал: [q] Vkzh87 написал:
[q] Мы с единомышленниками сейчас пытаемся ускорить процесс индексации, пока наиболее рабочий вариант это чтение книг с голосовым набором текстового файла, а потом Claude этот текстовый файл превращает в таблицу эксель с любыми нужными столбцами и фильтрами,
[/q]
На сколько близко к тексту происходит такая расшифровка? Что происходит, если в родном тексте документа рядом стоят Иоанн и Иоан, Федот и Хведот, Сигилинтия, Сигилития, Сиклинтия и Сгклитикия? Разницу он чувствует?[/q]
Чаще всего на ходу приходится корректировать сложные имена и названия нп, все равно быстрее чем все перепечатывать. --- Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии) | | |
Ivanovani Москва Сообщений: 323 На сайте с 2025 г. Рейтинг: 181 | Deepseek неплохо вылавливает логические ошибки в готовых расшифровках и условные "описки", но править ему готовый документ доверять нельзя, потому что родной текст документа он пытается подогнать под современный язык, а это есть искажение исходного текста.
Часто что-то пропускает и не учитывает. Из недавних кейсов: делаю запрос на цензуру фамилий, прошу их заменить на [Цензура]. Из 8 фамилий 2 не цензурирует. --- Предпочитаю первоисточники | | |
Ivanovani Москва Сообщений: 323 На сайте с 2025 г. Рейтинг: 181 | Vkzh87 написал: [q] на ходу приходится корректировать сложные имена[/q]
Как это происходит? У меня исповедка на полторы тысячи человек. Я должна сесть и проверить построчно, все ли он корректно понял? --- Предпочитаю первоисточники | | |
| Vkzh87 Новичок
п. Пестяки Ивановской области Сообщений: 19 На сайте с 2020 г. Рейтинг: 20 | Ivanovani написал: [q] Vkzh87 написал:
[q] на ходу приходится корректировать сложные имена
[/q]
Как это происходит? У меня исповедка на полторы тысячи человек. Я должна сесть и проверить построчно, все ли он корректно понял?[/q]
время для таких объемов еще не наступило))) я имел ввиду корректировка на ходу при голосовом наборе, автоматом пока не получается, много глюков --- Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии) | | |
| Vkzh87 Новичок
п. Пестяки Ивановской области Сообщений: 19 На сайте с 2020 г. Рейтинг: 20 | Ivanovani написал: [q] Deepseek неплохо вылавливает логические ошибки в готовых расшифровках и условные "описки", но править ему готовый документ доверять нельзя, потому что родной текст документа он пытается подогнать под современный язык, а это есть искажение исходного текста.
Часто что-то пропускает и не учитывает. Из недавних кейсов: делаю запрос на цензуру фамилий, прошу их заменить на [Цензура]. Из 8 фамилий 2 не цензурирует.[/q]
Пробуйте более мощные модели. Лучше через claude, он в этом сейчас наверно топ --- Ищу Железновых, Макаровых, Ворониных, Смирновых, Кручининых, Дуреевых, Корюковых, Соловьевых, проживавших в Пестяковском районе Ивановской области (бывш. Гороховецкий уезд Владимирской губернии) | | Лайк (1) |
| К данной теме присоединена тема "ИИ в генеалогии" (17 марта 2026 20:41)
|
|