⮉

Нарисуйте свое древо. Бесплатно. Онлайн. [х]

На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!

VGD.ru

РЕГИСТРАЦИЯ

Войти

Поиск

Раздел Генеалогия: теория и практика » Генеалогическое программное обеспечение » Генеалогические программы и сайты

Вниз ⇊

Инструменты ИИ (AI) для генеалогического исследования

Все, что касается искусственного интеллекта, в помощь в исследованиях

← Назад Вперед →

Страницы: ← Назад 1 2 3 * 4 5 6 Вперед →
Модераторы: A1enushka, Руслан Дикушин, apuzanoff

ciberhunter

Барнаул FTDNA IN12531 GEDMATCH T775758
Сообщений: 1629
На сайте с 2015 г.
Рейтинг: 441

Наверх ## 13 августа 2025 15:02

Коллеги, я уверен, что надо пробовать. А не подрывать моральный настрой тех кто хочет попробовать. Если вы совсем не понимаете в теме, не надо ставить палки в колеса. Да древние движки брешут очень сильно. Но чем больше обучают ИИ, тем они становятся совершенней. Ищу единомышленников. Считаю надо разбивать проблему на более мелкие. И мелкими шашками достигать истины.
Постановка задачи.
Есть куча архивов в виде фотографий и сканов документов.
Вижу подобные шаги
1 Необходимо для начала просто прочитать файлы и распознать их OCR движком
2 Для начала думаю не надо учить распознавать ИИ структуру документа. Просто для начала сделать контекстный поиск по документам. На полное распознание структуры не берется даже Yandex
3 Предусмотреть возможность создания данных для обучения ии в области распознания и в области обработки данных.
4 Я установил движки Deepseek-r1 и GPT-oss пока играюсь, но хотел бы научиться дообучать модели. В идеале бы найти программиста который бы помог написать нужные скрипты.
5. Постепенно надо как-то научить ИИ понимать структуру документа.
6. Цель научить ИИ обрабатывать запросы к локальной базе фото.

Как автор платить за распознание каждой страницы я не могу, у меня количество фото скоро достигнет 100тыс. Если бы я мог предложить людям проект, то таких фото было бы миллионы.

---
Клочки, Бельмесево, Бураново, Калманка, Стежки, Дегтянка, Верхние пупки, Малые пупки, Березовка, Тамбовка, Незнановка, Просечье
тг @chelnavskii Челнавский стан
тг @barnaul_genealogy Барнаульский уезд
тг @lysie_gory Лысые горы Тамбовский уезд и выселки Незнановка, Беломестная криуша, Козмодемьянов

Лайк (4)

severinn Сообщений: 7340 На сайте с 2005 г. Рейтинг: 2502	Наверх ## 13 августа 2025 15:12 это задача не 21 века на современном уровне не решить

vishnevskiy_74

Сообщений: 965
На сайте с 2013 г.
Рейтинг: 6285

Наверх ## 13 августа 2025 15:54

severinn написал:

[q]
это задача не 21 века
на современном уровне не решить
[/q]

Вполне решаема уже на текущем этапе (и примеры Yandex archive и FamilySearch, eScriptorium пример и т.п. перед глазами), вопрос в поиске заинтересованных лиц, деньгах и трудозатратах.

---
Автор справочника фамилий Оренбургского казачьего войска, а также причисленных к нему территорий и сословий, 1816 - 1850 гг. Мой дневник.

Лайк (1)

vishnevskiy_74

Сообщений: 965
На сайте с 2013 г.
Рейтинг: 6285

Наверх ## 13 августа 2025 16:02 13 августа 2025 16:06

vishnevskiy_74 написал:

[q]

severinn написал:
[q]

это задача не 21 века
на современном уровне не решить
[/q]

Вполне решаема уже на текущем этапе (и примеры Yandex archive и FamilySearch, eScriptorium пример и т.п. перед глазами), вопрос в поиске заинтересованных лиц, деньгах и трудозатратах.

[/q]

Про eScriptorium можно почитать здесь и здесь— это открытое веб-приложение для работы с историческими документами (печатными и рукописными): загрузка изображений/сканов, разметка и сегментация страниц, автоматическая и ручная транскрипция, обучение собственных моделей и экспорт результатов. Движок вот этот. Пишут про возможность полнотекстового поиска . И про возможность локального развертывания

Лайк (1)

Kolob-07

Санкт-Петербург
Сообщений: 5216
На сайте с 2008 г.
Рейтинг: 4027

Наверх ## 13 августа 2025 17:58

Не так давно было сообщение в прессе, что ИИ прочитал плохо сохранившийся старинный документ. До этого его "натаскивали" на конкретный почерк конкретного документа, а уж потом он по обрывкам слов и букв восстанавливал текст. Т.е. и очень сложные задачи уже сейчас решаются. Вопрос в средствах и специалистах.
А школьникам домашнее сочинение уже и сейчас запросто напишет.

Лайк (5)

ciberhunter

Барнаул FTDNA IN12531 GEDMATCH T775758
Сообщений: 1629
На сайте с 2015 г.
Рейтинг: 441

Наверх ## 14 августа 2025 3:33

В том и дело, что нейросеть как человек. Первые несколько лет будет ошибаться, а потом почерк врачей начнет читать. Притом прогресс в последнее время идет 7 мильными шагами.

Лайк (1)

ciberhunter

Барнаул FTDNA IN12531 GEDMATCH T775758
Сообщений: 1629
На сайте с 2015 г.
Рейтинг: 441

Наверх ## 14 августа 2025 11:21 14 августа 2025 14:28

Кто-нибудь может помочь с установкой kra.ken ocr ?

vishnevskiy_74

Сообщений: 965
На сайте с 2013 г.
Рейтинг: 6285

Наверх ## 15 августа 2025 15:36

Kolob-07 написал:

[q]
Не так давно было сообщение в прессе, что ИИ прочитал плохо сохранившийся старинный документ. До этого его "натаскивали" на конкретный почерк конкретного документа, а уж потом он по обрывкам слов и букв восстанавливал текст. Т.е. и очень сложные задачи уже сейчас решаются. Вопрос в средствах и специалистах.
А школьникам домашнее сочинение уже и сейчас запросто напишет.
[/q]

Тут пишут, что ИИ уже смог прочесть свитки из Геркуланума (сосед Помпей), обугленные извержением 79 г. н. э. Их читают, не разворачивая, с помощью синхротронной рентгеновской фазоконтрастной томографии (XPCT) и «виртуального разворачивания» плюс ИИ для обнаружения букв. В 2024–2025 гг. прорыв дал проект Vesuvius Challenge: удалось извлечь крупные фрагменты греческого текста, а в феврале–мае 2025 впервые по рентген-сканам определили автора и название одного из свитков — философ Филодем, «О пороках».
Цель — массовое чтение целых текстов библиотеки Виллы папирусов.

https://time.com/6691588/ancient-roman-scroll-decoded-ai/

https://scrollprize.org/firstletters

https://www.ox.ac.uk/news/2025...2000-years

https://www.theguardian.com/sc...ius-scroll

https://www.nature.com/articles/ncomms6895

https://www.diamond.ac.uk/Home...22025.html

Лайк (7)

AlexandraMo

Участник

Сообщений: 77
На сайте с 2025 г.
Рейтинг: 99

Наверх ## 16 августа 2025 16:38

Спасибо за тему!

Использую ChatGPT, хорошо помогает в таких случаях:

- общие вопросы о конкретных сословиях, исторических фактах, хорошо сопостовляет и подсказывает с учётом географии и времени
- отлично ищет по редким фамилиям с учетом ограничений, этот форум хорошо сканирует и подбивает информацию
- собрал информацию по определенной фамилии на сайте о первой мировой, всех (более 130 человек) оформил в таблицу, теперь могу автоматически сортировать по региону проживания, годам жизни, попросить сделать анализ
- подсказывает по архивам и фондам (не всегда идеально, надо перепроверять его ссылки), но фонды и описи находит

Расшифровывает МК плохо, некоторое додумывает. Если кто-то посоветует что-то для этого, буду рада. Ну или возможные полезные промпты для любых задач по генеалогии

---
Буевы, Лацковы, Сарвины
Горностай, Тарадай, Кравец, Касянец, Пастернак, Лысак -- с Троща, Житомирский
Куй-Беда, Даниловы, Фоменко, Радивиловы, Гасай -- Суджанский уезд
Литовкины -- Сердобский уезд, Саратовская
Савинковы -- Оренбургский уезд
Беловы -- Шигонь, Пенза

Лайк (7)

Руслан Дикушин Модератор раздела Россия Сообщений: 1751 На сайте с 2011 г. Рейтинг: 19953	Наверх ## 17 августа 2025 13:46 Пользователь severinn изгнан из раздела "Генеалогические программы и сайты" за флейм, тема почищена. --- Дикушины, Исаковы, Мухины Нижегородская г, Балахнинский у.Рудневы
	Лайк (7)

← Назад Вперед →

Страницы: ← Назад 1 2 3 * 4 5 6 Вперед →
Модераторы: A1enushka, Руслан Дикушин, apuzanoff

Генеалогический форум » Генеалогия: теория и практика » Генеалогическое программное обеспечение » Генеалогические программы и сайты » Инструменты ИИ (AI) для генеалогического исследования [тема №166478]

Сайт использует cookie и данные об IP-адресе пользователей, если Вы не хотите, чтобы эти данные обрабатывались, пожалуйста, покиньте сайт
Пользуясь сайтом вы принимаете условия Пользовательского соглашения, Политики персональных данных, даете Согласие на распространение персональных данных и соглашаетесь с Правилами форума
Содержимое страницы доступно через RSS
© 1998-2026, Всероссийское генеалогическое древо
16+ Правообладателям