Загрузите GEDCOM-файл на ВГД   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Genotek ADs
Вниз ⇊

Архивный хакатон

Главархив Москвы проведет конкурс для разработчиков в сфере ИИ

← Назад    Вперед →Страницы: 1 * 2 3 Вперед →
Модераторы: Ella, Gnom7
Alina_S
Администратор

Alina_S

Санкт-Петербург
Сообщений: 1646
На сайте с 2009 г.
Рейтинг: 5659
Главархив Москвы приглашает команды разработчиков, аналитиков и IT-специалистов создать веб-сервис на базе искусственного интеллекта для автоматического извлечения информации из архивных документов.

Сервис извлечения и индексирования информации из образов архивных документов (Ретроконверсия)
Задача 09
https://i.moscow/lct/hackatons...66adc2/ru/

Главархив Москвы предлагает заглянуть в прошлое с помощью инструментов будущего. Командам предстоит разработать веб-сервис на базе ИИ, который позволит автоматически извлекать информацию из рукописных и машинописных архивных документов, индексировать ее и загружать в цифровую систему хранения. Сервис должен распознавать документы, сочетающие рукописный и печатный текст, с точностью не менее 95 процентов, а также включать инструменты для проверки и коррекции извлеченных данных. Важной функцией станет возможность гибкой выгрузки информации по заданным критериям. При этом система должна работать автономно, без доступа к внешним ресурсам, что позволит обеспечить безопасность и целостность архивных данных.
Источник: https://www.mos.ru/news/item/157387073/

Научите ИИ читать дореволюционные документы

* Задача от города 9 — автоматизировать процесс извлечения данных из архивных образов до 1917 года от Главархива Москвы.

* Что нужно сделать:
Разработать сервис на основе искусственного интеллекта для распознавания и извлечения информации из образов архивных рукописей до 1917 года. Решение должно уметь быстро и качественно «читать» старинные документы и преобразовывать их в печатный формат.

* Почему это важно:
Задача позволит ускорить оцифровку и обработку огромного массива исторических документов, пополнить базы данных и упростить доступ к информации для исследователей, историков и москвоведов.

‼ Призовой фонд задачи

1 место — 1 000 000 ₽
2 место — 600 000 ₽
3 место — 400 000 ₽

Источник: vk.cc/cOu8as и https://vk.com/wall-185263155_1921

Прием заявок до 18 сентября.

Разработка решений - 18 сентября - 2 октября.
Техническя экспертиза - 3-21 октября.
Питч-сессии - 22-23 октября.
Церемония награждения - 24-25 октярбря офлайн в Москве

Подать заявку https://i.moscow/lct/hackatons...66adc2/ru/
Лайк (7)
TatianaLGNN
Модератор раздела
ВГД дарит удочку. Рыбу ловить должны вы сами

TatianaLGNN

Нижний Новгород
Сообщений: 25445
На сайте с 2003 г.
Рейтинг: 7689
Такое чувство, что конкурс объявили простите "дубы" не сказать грубее.
Можно подумать за полтора месяца это можно сделать.
Туфта полная. А главное призы. Лучше ничего не делать, чем за такие деньги.
Я в трансе
---
Уважаемые друзья, вновь пришедшие на форум. Очень прошу, прежде чем задать мне вопрос в личку, ну почитайте немного форум.И потом мои знания распространяются не на всю бывшую Российскую империю, а в основном на Нижегородскую губернию.
_______
https://forum.vgd.ru/899/

Лайк (4)
TatianaLGNN
Модератор раздела
ВГД дарит удочку. Рыбу ловить должны вы сами

TatianaLGNN

Нижний Новгород
Сообщений: 25445
На сайте с 2003 г.
Рейтинг: 7689
В задании сказано до 1917, но не сказано с какого
Почерк 17 века, 18 века и 19 и даже 20 большие разницы. Чтобы распознавать все эти времена, надо как минимум 1 миллион образов кадров.
Причём начиная от ИР , РСи метрик.
А как быть с текстом, который клинописью? Его как ИИ будет читать?
А как быть с текстом 18твека, когда часто идёт сплошником.
Полтора месяца на решении задачи, которой как минимум год полтора нужно.
---
Уважаемые друзья, вновь пришедшие на форум. Очень прошу, прежде чем задать мне вопрос в личку, ну почитайте немного форум.И потом мои знания распространяются не на всю бывшую Российскую империю, а в основном на Нижегородскую губернию.
_______
https://forum.vgd.ru/899/

Лайк (3)
s_fedot

s_fedot

Москва
Сообщений: 1614
На сайте с 2013 г.
Рейтинг: 1446

Wladzislaw написал:
[q]
Какие смешные деньги для озвученной задачи.
[/q]



Товарисчи видимо считают по простому - мульон за три недели... А что этому предшествовало и на каком уровне должен быть даже не один специалист, а все...
Я не одобряю задранные расценки IT специалистов, но в данном случае оплата не соответствует...

Мы с добровольцами пятый год работаем с описями РГАДА, начиная с 18 века. И тексты дел набираем, согласно археографическим правилам.
И все равно приходится составлять преамбулы по каждому почерку писца, секретаря, и т.д.
И только перекрестное изучение документов приводит к результату.
И я регулярно подсовываю дипсику УЖЕ НАБРАННЫЕ ТЕКСТЫ, так вот семантика, порядок слов, смысл написания предложений не всегда им определяется.
Приходится поправлять, прежде чем в него запустить на проверку объем уже набранных текстов.
И это всё равно не является конечным результатом, я только прошу указать на что-н, что я не заметила.
Отдавать на полную корректировку нельзя. Изменяет то, что не просишь.

И самые сложные даже не скорописные документы, а заборы 19 века, где все буквы написаны одинаково - м, т, ш, к, и, п
Тут даже со знанием фамилий и населенных пунктов проблема.

Поэтому, кто куда, а мы учиться, учиться и учиться. Спасение утопающих в море информации - дело рук и голов их же ...101.gif
---
Еженедельно по воскресеньям с 10.00 до 12.00 провожу открытый аудиочат в ВК,
зайти можно без аккаунта по постоянной ссылке
https://vk.com/call/join/w3xja68MHgoWk9G-2Oqn_WN5E5FzkHX496ZSd2cDl-g
Лайк (9)
TatianaLGNN
Модератор раздела
ВГД дарит удочку. Рыбу ловить должны вы сами

TatianaLGNN

Нижний Новгород
Сообщений: 25445
На сайте с 2003 г.
Рейтинг: 7689
>> Ответ на сообщение пользователя s_fedot от 24 августа 2025 20:04
Вот и я про то

---
Уважаемые друзья, вновь пришедшие на форум. Очень прошу, прежде чем задать мне вопрос в личку, ну почитайте немного форум.И потом мои знания распространяются не на всю бывшую Российскую империю, а в основном на Нижегородскую губернию.
_______
https://forum.vgd.ru/899/

Лайк (1)
TatianaLGNN
Модератор раздела
ВГД дарит удочку. Рыбу ловить должны вы сами

TatianaLGNN

Нижний Новгород
Сообщений: 25445
На сайте с 2003 г.
Рейтинг: 7689
Хакатон в данном деле вообще не уместен
---
Уважаемые друзья, вновь пришедшие на форум. Очень прошу, прежде чем задать мне вопрос в личку, ну почитайте немного форум.И потом мои знания распространяются не на всю бывшую Российскую империю, а в основном на Нижегородскую губернию.
_______
https://forum.vgd.ru/899/

kgvista

Антарктида
Сообщений: 178
На сайте с 2016 г.
Рейтинг: 516

Alina_S написал:
[q]
создать веб-сервис ... При этом система должна работать автономно, без доступа к внешним ресурсам
[/q]

Да... ощущение, что ТЗ писали "специалисты", усиливается 101.gif. То есть конечно технически можно держать веб-сервис во внутреннем контуре, но это и лишний геморрой и при разработке, и не удобно самому пользователю-архиву.
Ну а приз не покроет даже расходы на разработку веб-интерфейса
---
Галичские и Пшеничниковы (Варнавинский у.), Бодуновы и Веригины (Осташков), Нечаевы (Максатиха), Дьяковы и Манаковы (Прилуки Онеж.у.).
Трембачевы (Острогожский у.), Черноволовы (с.Ильинка Оренбургский у.), Пелипенко (х.Нижнетиховский ОВД), Ляпины (Ундол), Лариковы (Карасан), Тубасовы (Крым)
Лайк (3)
Alina_S
Администратор

Alina_S

Санкт-Петербург
Сообщений: 1646
На сайте с 2009 г.
Рейтинг: 5659
Спасибо всем за мнения! heart.gif

Я думаю, все же лучше обсуждать такие конкурсы, чем совсем ничего - молчание и бездействие. Понимаю, что система инертна, но кто, как не специалисты, могут хоть как-то повлиять на нее?
TatianaLGNN
Модератор раздела
ВГД дарит удочку. Рыбу ловить должны вы сами

TatianaLGNN

Нижний Новгород
Сообщений: 25445
На сайте с 2003 г.
Рейтинг: 7689

Alina_S написал:
[q]
Спасибо всем за мнения!

Я думаю, все же лучше обсуждать такие конкурсы, чем совсем ничего - молчание и бездействие. Понимаю, что система инертна, но кто, как не специалисты, могут хоть как-то повлиять на нее?
[/q]

Тех задание с точки зрения программирования должны писать программисты и системные аналитики, а не архивисты
Они просто не в состоянии понять техническую сторону проблемы


---
Уважаемые друзья, вновь пришедшие на форум. Очень прошу, прежде чем задать мне вопрос в личку, ну почитайте немного форум.И потом мои знания распространяются не на всю бывшую Российскую империю, а в основном на Нижегородскую губернию.
_______
https://forum.vgd.ru/899/

s_fedot

s_fedot

Москва
Сообщений: 1614
На сайте с 2013 г.
Рейтинг: 1446

TatianaLGNN написал:
[q]
Тех задание с точки зрения программирования должны писать программисты и системные аналитики, а не архивисты
[/q]


Одним технарям тоже писать тз нельзя, так как много специфических моментов не учитывается.
Только вместе.
---
Еженедельно по воскресеньям с 10.00 до 12.00 провожу открытый аудиочат в ВК,
зайти можно без аккаунта по постоянной ссылке
https://vk.com/call/join/w3xja68MHgoWk9G-2Oqn_WN5E5FzkHX496ZSd2cDl-g
Лайк (2)
Alina_S
Администратор

Alina_S

Санкт-Петербург
Сообщений: 1646
На сайте с 2009 г.
Рейтинг: 5659
Однозначно лучше сообща. Как всех объединить - вот главный вопрос.
Лайк (1)
← Назад    Вперед →Страницы: 1 * 2 3 Вперед →
Модераторы: Ella, Gnom7
Генеалогический форум » Читать всем! » Новости » Архивный хакатон [тема №173496]
Вверх ⇈