Чтобы не гадать, что произошло, сделал полное сканирование раздела с ревизскими сказками и исповедными ведомостями.
Полная раскладка по текущему состоянию дел со сказками и исповедками в прилагаемых экселевских файлах.Есть две новости. Как обычно, плохая и хорошая.
1. Чуда не произошло. Новых ревизских сказок и исповедок не появилось. Все добавленное количество дел получилось за счет ошибочного дублирования.
Ряд литерных дел при первой публикации изначально был выгружен с ошибкой. Дело вроде бы было, а сканы по нему не отображались. После сообщений пользователей об ошибках, нерабочие дела исправляли. Сейчас после какой-то выгрузки/синхронизации наряду с рабочими ссылками на сайте ЦГАМ появились старые нерабочие ссылки.
В прилагаемых файлах красным цветом выделены все нерабочие ссылки по литерным делам, которые есть на текущий момент (17шт в ревизских сказках и 3шт в исповедках)
2. У ~98% процентов ревизских сказок и исповедных ведомостей за последнее время поменялось описание. Я сначала подумал, что при сравнении старых и новых описаний что-то некорректно сработало. Но все сработало точно. Причина изменения описаний - В описания всех сказок и исповедок (в сумме более 700дел) за редкими единичными исключениями
было добавлено название губернии и название уезда. За счет этого теперь поиск станет работать еще лучше. Это относится ко всем типам поиска (внутренний на сайте ЦГАМ, поисковыми системами, а также в экселевских файлах)
О чем говорит массовое изменение описаний? Это говорит о том, что сотрудники архива читают эту ветку и прислушиваются к советам и замечаниям. Сообщение о том, что в описаниях дел очень не хватает названия уезда было опубликовано две недели назад вот здесь
https://forum.vgd.ru/post/481/116535/p3892820.htm#pp3892820 Замечание в большей степени относилось к описанием метрических книг, но оно так же относится и к ревизским сказкам и исповедкам.
И еще важный вывод и совет для работников архива.Сервис "Моя семья" на сайте ЦГАМ работает примерно 9 месяцев. Начиная с выгрузки первой партии дел, практически каждая публикация новых дел, включая выгрузки метрических книг, сказок и исповедных ведомостей содержала ошибки в ряде литерных дел. Сегодняшняя синхронизация показала, что таких проблемных дел только в ревизских сказках и исповедных ведомостях было не менее 24шт. Сколько таких изначально нерабочих дел было среди метрических книг, неизвестно. Но мы можем предположить, что в разделе метрических книг таких дел, которые пришлось исправлять, должно быть еще больше.
Очевидно, что есть системная проблема с добавлением и публикацией литерных дел. Ошибка возникает из-за попадания буквы на кириллице в какое-то проблемное место. Это может относиться или к ссылке, или к названию папки, или к называнию файлов, или к какой-то внутренней обработке. Но ясно одно, что ошибка повторяется вновь и вновь. Отличить, к примеру, букву "А" на кириллице и букву "A" на латинице человек визуально не может, а значит нас ждет продолжение публикаций с рядом нерабочих ссылок.
Как программист и человек, имевший опыт контроля наполнения сайта, могу сказать следующее. Можно сколько угодно придумывать правила для сотрудников, наполняющих сайт или ведущих исходную базу, можно ежедневно перед началом рабочего дня просить всех повторять наизусть, какие буквы нельзя использовать в названии дел, ссылок, файлов итп, но рано или поздно кто-то эти правила в нужный момент "забывает". И даже, если кто-то выучил инструкции "до слез" и никогда не ошибается, придет новый сотрудник и все начнется сначала.
Вместо того, чтобы пытаться следить за буквами в названии дел и вместо постоянных исправлений нерабочих дел, там где за буквой недоглядели, можно разрешить сотрудникам, наполняющим сайт, писать любые буквы в названии дел, а программистам при этом поставить следующую задачу:
Везде, где нелатинские символы могут приводить к проблеме, требуется программно автоматически производить замену кириллицы на латиницу. В идеале еще и удаляя недопустимые символы. Т.е., при публикации нового дела, если сотрудник где-то ввел номер дела с кириллицей и недопустимыми символами, оно автоматически должно заменяться на латиницу+цифры. К примеру "555 А ." должно автоматически меняться на "555A" - только на латинице. Тогда не будет возникать нерабочих ссылок итп. И даже если номера новых дел импортируются из уже давно заполненной внутренней базы архива, это ничего не меняет. В том месте кода, где данные попадают на сайт, где формируются ссылки, папки итп, нужно ставить автоматическую проверку и замену.
Программная реализация замены недопустимых символов в критических местах - это очень простая задача. Программистам потребуется час времени на ее реализацию. С учетом постановки задачи, анализа, программирования, тестирования итп, может потребуется несколько часов. Но в любом случае это в дальнейшем сэкономит много времени, как сотрудникам архива, так и пользователям сайта.
Руководство архива связалось с администрацией сайта ВГД, сообщило, что следит за дискуссией на нашем форуме и высказало свою заинтересованность в качественном предоставлении контента для исследователей. По просьбе ГБУ ЦГА Москвы закрепляем вот это их сообщение
сообщение от 3 июня 2021 года: