На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Перед тем, как ставить оценку, ознакомьтесь с главной страницей рейтинга архивов, чтобы понять оцениваемые критерии. Оценка 1 - очень плохо, 10 - очень хорошо;
Оценка архива как оффлайн-сервиса:
Оценка архива как онлайн-сервиса:
Ваш голос учтен!
Выгрузки данных в Excel из АИС ЦГА Москвы и СПИСОК ФОНДОВ
Записи по МК, ИВ, РС, опубликованным на сайте ЦГАМ. Учет, отслеживание изменений, немного магии, аналитика. Записи из "Научно-Справочного Аппарата", "Мегатаблицы"...
ОБНОВЛЕННЫЕ МЕГАТАБЛИЦЫ В ЭКСЕЛЕ - 203 И 51 ФОНДЫ Данные по состоянию на 04.02.2022
Вторая версия "мегатаблиц". См. прилагаемый файл.
Эти таблицы будут полезны всем, и исследователям, и сотрудникам архива. Это не замена старых таблиц (со списками метрических книг), а дополнение к дальнейшее развитие. По сравнению с предыдущей версией "мегатаблиц" месячной давности, кроме обновления источников, был произведена работа над ошибками и дополнительная работа по улучшению удобства пользования.
Для тех, кто встречается с мегатаблицами впервые приведу описание, частично предыдущее, частично дополненное.
Для того, чтобы получить эти мегатаблицы, собираются данные из НСА (Научно справочный аппарат), затем объединяются с данными по метрикам, исповедкам, и ревизским сказкам, собранным на основном сайте ЦГА Москвы в разделе "Моя семья". Данные в этих источниках не связанны и для того, чтобы найти соответствие строк в разных источниках формируются "ключи", которые позволяют однозначно идентифицировать каждую запись и далее их сопоставлять друг с другом. После объединения, выбрасывается лишнее, проводится сравнение данных из двух источников, выделение ошибок, несоответствий, а также строк, содержащих записи о делах, уже оцифрованных, но пока не выложенных на сайт.
В данной таблице представлен:
203 фонд - записи по всем метрическим книгам (описи 745, 750, 764, 768, 771, 776, 777, 780, 782) - 9971 записей
203 фонд - записи по исповедным ведомостям (опись 747) - 2113 записей
51 фонд - записи по ревизскими сказкам (опись 8) - 988 записей
По указанным разделам данные в НСА представлены хоть и с пробелами, но довольно полно. Таким образом, первое, что мы получаем: Почти полную опись в табличном виде по всем метрикам, исповедкам и ревизским сказкам 203 и 51 фонда.
До этого в трех отдельных таблицах был только список дел, выложенных на сайте в разделе Моя семья (а это далеко не все, что есть) и многостраничные сканы описей в PDF формате. Описи в PDF формате точные, но они разбросаны по разным томам, отметки там стоят по состоянию на дату сканирования, несколько лет назад, а главное в них очень непросто и очень не быстро искать даже при наличии опыта.
Поскольку данные объединяются, теперь у нас в файле сразу два описания. Первое из базы НСА, оно обычно есть, но далеко не всегда. Второе описание есть в случае, если дело выложено на основном сайте. Можно отфильтровать дела, выложенные на сайте без описания и сразу посмотреть описание из базы НСА. Или, если есть какие-то сомнения в описании на сайте, можно сравнить его с данными из НСА.
Для всех выложенных на сайте дел, есть ссылка для просмотра в разделе "Моя семья".
Объединение данных открывает нам новые возможности.
Можно посмотреть отметки ОФП в базе НСА и сравнить их с сайтом.
1. Таким образом, в базе НСА можно найти записи, в которых забыли поставить отметку ОФП. Если дело выложено на сайте, то оно точно отсканировано и отметка в НСА должна быть. Но в представленном куске НСА есть более 100 дел, где забыли поставить эту отметку.
2. А можно найти записи, по которым в базе НСА стоит отметка ЭФП, но при этом дело не выложено на сайт. Это, как минимум, означает, что такое дело можно посмотреть без заказа в читальном зале. А еще это может означать, что, в перспективе уже отсканированные дела появятся могут появится в последующих выгрузках при обновлении раздела сайта "Моя семья".
Для более удобной фильтрации дел по признаку ЭФП, я добавил столбец "ЭФП-diff". В этом столбце может быть четыре значения:
"НСА, Сайт" - это норма, дело имеет пометку ЭФП в базе НСА и оно выложено на сайт
"Сайт" - дело выложено на сайт, но у него нет пометки ЭФП в базе НСА. Такие записи помечены красным. Всего таких дел 103шт. Это "флаг" для работников архива, чтобы внесли пометку в НСА.
"НСА" - а это те самые дела отсканированные, но не выложенные на сайт. Они помечены "золотым" цветом.
"НСА-У" - это виртуальное дело. Фактически это всего лишь продолжение очень длинного описания, не помещающегося в одно поле, основного дела.
Кроме этого появилась возможность сверить год и количество страниц в двух источниках. Если есть расхождение, то значит высокая вероятность ошибки. Год сравнивается даже при условии вольного написания. Например, запись "(1912,1913-1918) и " 1912-" будут считаться совпадающими. По году дополнительно проверяется слишком низкое значение. Разница и ошибки в записях по году отмечаются красной заливкой.
При сравнении количества страниц встречаются записи с большим расхождением. Если разница двух источников по одному делу составляет более 50 страниц, то число страниц помечается красным шрифтом. У этой проверки есть исключение. Опись 745, 203 фонда не проверяется, поскольку там очень много "виртуальных дел"...
Совсем все типы ошибок я не стал раскрашивать цветом. Применений прилагаемого файла для контроля ошибок может быть гораздо больше. Например, можно отобрать записи в НСА, у которых вообще не указан год, но при этом год указан в записях на сайте. Или наоборот. И после этого можно год быстро скопировать из одной базы в другую.
При наличии расхождений в двух версиях можно перейти прямо из таблицы на сайт и посмотреть сканы. В 99% случаев в разделе Моя семья будет более точная информация.
И по аналогии с предыдущими таблицами в мегатаблице представлены "вычисляемые" колонки "Год1", "Год2" и "Все годы", которые позволяют искать и фильтровать записи по году в случаях, когда в оригинале год не указан явным образом, а указан, например, диапазоном. фильтры" -> "между" -> 1860 и 1870.
Обращаю внимание, особенно сотрудников архива, что Excel позволяет фильтровать и сортировать колонки не только по значению, но и по цвету. Это может пригодиться для выбора всех строк с каким-нибудь типом ошибки. Например, чтобы выбрать все строки с расхождением и ошибками в годе, ставим фильтр по цвету - красная заливка. А для того, чтобы выбрать все записи с большим расхождением по количеству страниц, ставим фильтр по цвету - красный шрифт.
Список сокращений в таблице:
ФП - Фонд пользования (копия оригинала в каком-то виде)
СФ - Страховой фонд (копия на пленке)
ЭФП - Электронный Фонд Пользования (дело отсканировано и доступно на компьютере в читальном зале, а некоторые доступны и на сайте)
ОЦ - Особая ценность
УД - Уникальные документы
В следующем сообщении будет иллюстрация по мегатаблицам. А уже последующие обновления через месяц будут без таких длинных описаний.
В прилагаемом файле отобраны записи, которые изменились в базе НСА примерно за месяц (за Январь 2022г). Сравнивались все данные (примерно 89тыс записей), которые есть в онлайн-базе НСА.
В первую очередь меня интересовало, у каких дел за месяц появилась свежая отметка "ЭФП". Всего таких дел было найдено ~239шт, а именно
203ф 745оп - 2шт
203ф 747оп - 20шт (исповедки, в январе на сайт выложена только половина)
203ф 764оп - 1шт
203ф 776оп - 1шт
203ф 776оп - 81шт (эти все выложены на сайт в январе)
1472ф 1оп - 52шт
2124ф 2оп -1шт
Таким образом, теперь мы знаем, что именно сканировал архив в январе 2022, а может быть пораньше - в декабре 2021г. На сайт выложено далеко не все. То, что пока не выложено можно посмотреть на компьютерах читального зала.
ОБНОВЛЕННЫЕ МЕГАТАБЛИЦЫ В ЭКСЕЛЕ - 203 И 51 ФОНДЫ Данные по состоянию на 08.02.2022
Вчера я выкладывал "мегатаблицу" с записями по состоянию на 04.02.2022. Сегодня ЦГАМ выгрузил обновления в копию базы НСА на сайте. Добавилось сразу 760 новых записей. Все по 203 фонду, 745 описи.
И хотя с момента предыдущей таблицы прошло всего несколько дней, я решил обновить мегатаблицу.
Вообще, обновления в базу НСА на сайте попадают не в ежедневном режиме, а выкладываются партиями один или несколько раз в месяц. Поэтому следующие обновления и тем более крупные, скорее всего, не раньше чем через несколько недель могут быть.
Дополнительно сюда же прикладываю файл со списком новых записей, которые сегодня появились в НСА.
Наверх##22 февраля 2022 14:1422 февраля 2022 14:34
ОБНОВЛЕННЫЕ ФАЙЛЫ В ФОРМАТЕ EXCEL с полной информацией ПО МЕТРИЧЕСКИМ КНИГАМ, ИСПОВЕДНЫМ ВЕДОМОСТЯМ И РЕВИЗСКИМ СКАЗКАМ, выложенным на сайте ЦГА Москвы, с учетом изменений на сайте с 03/02/2022 по 22/02/2022. См. вложение.
В ФЕВРАЛЕ 2022 Г. ДОБАВЛЕНЫ НОВЫЕ ДЕЛА С МЕТРИЧЕСКИМИ КНИГАМИ:
Кроме того в файлах отражено перемещение за прошедший месяц некоторых дел из раздела "метрические книги" в раздел "исповедные ведомости" и "ревизские сказки".
Начиная с этой версии, в таблицах реализован новый алгоритм по заполнению описаний дел.
В случае, если на сайте ЦГАМ в разделе "Моя Семья" дело не подписано и/или по нему не указаны "годы", то такая информация берется из другого источника - НСА (Научно справочный аппарат)https://nsa.cgamos.ru/ . Причем, в базе НСА по некоторым делам описания из-за слишком длинного текста разбиваются на 2-3-4 отдельные записи, в каждой из которых содержится только часть текста. Все такие записи находятся и перед копированием объединяются в одну.
В случае, если и в НСА не находятся данные с описанием и/или датами, то используется еще одни источник, - гугл-таблица с заголовками дел, наполнением которой занимаются волонтеры с этого форума.
Несмотря на то, что гугл-таблица заполнена, все желающие могут там вносить правки. Это может быть как исправление ошибок и опечаток, так и дополнение существующих коротких заголовков более развернутыми данными. Кроме того эта же таблица будет использоваться в будущем в случаях, если в новых ежемесячных обновлениях на сайте ЦГАМ появятся еще "неподписанные" дела. В любой момент можете редактировать гугл-таблицу при необходимости.
В экселевских файлах описания, получены из альтернативных источников, выделены цветом и дополнительно подписаны "Данные из НСА: " или "Данные с форума: ".
На сайте ЦГАМ есть около 180 дел, в которых отсутствуют описания и/или годы. В результате применения описанных выше новых алгоритмов, в приложенных файлах все такие дела уже подписанны. На текущий момент в таком виде информации по выложенным на сайте ЦГАМ делам, больше нет нигде.
Список изменений в НСА (Научно Справочном Аппарате) ЦГА Москвы (https://nsa.cgamos.ru/) c 08/02/2022 по 02/03/2022.
В левом столбце указано, что изменено: New - новая запись Changed (Дт.) - изменена дата Changed (Оп.) - изменено описание Changed (ФП) - изменен статус ФП
За ~месяц у 239 дел появилась отметка ЭФП. В это число входят дела, которые в феврале были выложены на сайте в разделе "Моя семья". Сюда же входят несколько дел, которые были выложены на сайте давно, но по ним в базе НСА сразу забыли поставить отметку ЭФП. И сюда же входят несколько десятков недавно оцифрованных дел, которые на сайт пока не выложены.
Изменения прошли более чем в 10 фондах.
Среди прочего в 203 фонде по описи 745 продолжается наполнение описаний. Было добавлено более 300 записей по делам с номерами от 1340 по 1536. Все эти новые записи будут учтены позже при формировании "мегатаблицы" и таблицы с доступными онлайн метрическими книгами.
ОБНОВЛЕННЫЕ ФАЙЛЫ В ФОРМАТЕ EXCEL с полной информацией ПО МЕТРИЧЕСКИМ КНИГАМ, выложенным на сайте ЦГА Москвы, с учетом изменений на сайте с 22/02/2022 по 25/03/2022. См. вложение.
Напоминаю, что в случаях, когда на сайте ЦГА Москвы в разделе "Моя семья" у дела отсутствует описание, описание берется из базы НСА (https://nsa.cgamos.ru), а если и в НСА описания нет, то оно берется из таблицы, которую заполняют волонтеры https://docs.google.com/spread...sp=sharing
Обратите внимание в указанной выше гугл-таблице у тринадцати дел 203 фонда 745 описи пользователи форума в описании дел указали не только все церкви, но и номера всех страниц, на которых начинаются книги этих церквей. Все эти полные описания автоматически были скопированы в прилагаемый Excel-файл.
P.S. 27.03.2022 в 16:30 в этом сообщении заменил файл от 25.03.2022 на обновленный с исправлениями. В предыдущем файле были ошибки в описаниях, которые копировались из пользовательской гугл-таблицы.
СПИСОК ОПИСЕЙ И ФОНДОВ ЦГА МОСКВЫ Данные по состоянию на 16.04.2022
Новая таблица со списком всех описей и фондов ЦГА Москвы, информация о которых введена в Научно-Справочный Аппарат (НСА) https://nsa.cgamos.ru/ или в раздел "Моя семья" на сайте архива.
При формировании этой таблицы собираются и анализируются данные из 4 источников и в каждой записи для каждого поля выбирается лучший.
В таком виде этих данных нет нигде, даже на сайте архива. К примеру, в базе НСА часть названий описи указана в таблице, а часть или отсутствует или подписана так "см. аннотацию". Соответственно, если воспользоваться поиском по ключевому слову в базе НСА, то половина заголовков не найдется. В прикрепленной таблице такие заголовки описей, в которых встречается"см. аннотацию" заменены на текст из этой самой аннотации или объединены с этим текстом.
Кроме того, в объединенной таблице в списке есть несколько описей, которое отсутствуют в базе НСА, но есть в разделе с метрическими книгами на сайте архива. Т.е. в этом файле в списке описей больше, чем в базе НСА.
По описям и фондам кроме стандартных полей есть "аннотации" с более развернутым описанием, а также ссылки в базу НСА и (при наличии) на основной сайт ЦГА в категорию со списком выложенных метрических книг.
При создании таблицы для себя я в первую очередь планировал получить справочник, который можно будет программно подключать и использовать при формировании других таблиц, но получилось нечто большее. Файл cgam_opisi_i_fondi-20220416-172905.xlsx, 109 Кб
ТАБЛИЦЫ ПО Г. МОЖАЙСКУ И МОЖАЙСКОМУ УЕЗДУ Данные по состоянию на 21.04.2022
Выкладываю несколько новых таблиц, которые будут интересны исследователям Можайского уезда.
1. Фонд 592 Описи 1 и 2 в табличном виде. Название фонда: "МОЖАЙСКОЕ ДУХОВНОЕ ПРАВЛЕНИЕ ВЕДОМСТВА МОСКОВСКОЙ ДУХОВНОЙ КОНСИСТОРИИ, Г. МОЖАЙСК МОСКОВСКОЙ ГУБЕРНИИ."
Напомню, что опись1 фонда 592 до этого момента существовала только в бумажном виде. Скана этой описи нет, на сайте архива она не выложена и ранее с ней можно было ознакомиться только в оригинале в читальном зале или пролистав 250 страниц с результатами по запросу в НСА.
2. Таблица, со всеми записями из НСА (Научно-Справочного Аппарата), в которых встречается слово ~Можайск. Объединена со всеми записями 592 фонда. Ключевые слова подсвечены красным цветом.
Таблицы 2 и 3, проще говоря, - это все, что на текущий момент есть в базе НСА по Можайскому уезду. Имеются ввиду подписанные дела.
Для того, чтобы получить такие таблицы, в НСА делается несколько выборок с разными параметрами, затем полученные результаты объединяются, удаляются дубликаты, проводится сортировка, подключаются дополнительные столбцы, которых нет в оригинале, и наводится марафет. Например, для того, чтобы в большой выборке легче было работать с результатами, подключены дополнительные столбцы с названиями описей, фондов и ссылками на страницу описи в НСА. В частности как раз для такого подключения и нужен был справочник со списком всех описей и фондов, который собирался ранее и выложен в предыдущем сообщении.
Ниже копия моего приглашения из другой темы. Поскольку кто-то сообщение мог пропустить, выкладываю его здесь в слегка измененном виде.
Друзья, есть возможность принять участие в хорошем деле!
Речь пойдет о дополнительном наполнении полезной информацией экселевских файлов с метриками, исповедками, ревизскими сказками.
На первых этапах для формирования экселевских файлов со списками выложенных на сайт ЦГА Москвы книг собиралась информация с сайта из раздела "Моя семья". На следующих этапах для "неподписанных дел" описания автоматически стали подтягиваться из базы НСА (Научно-Справочный Аппарат). Но и в базе НСА есть пробелы и часть дел в экселевском файле оставалась неподписанной.
После этого была создана гугл-таблица со списком более сотни неподписанных дел, в которую пользователи с форума за очень короткий период внесли отсутствующие описания. Теперь используются и эти пользовательские описания, и в экселевских файлах не осталось ни одного неподписанного дела. Благодаря совместной помощи пользователей форума из экселевского файла получилась конфетка. Теперь есть возможность из конфетки сделать торт.
Что я предлагаю? У многих исследователей в процессе работы с метриками/исповедками/сказками накапливаются очень полезные данные и наработки, иногда даже уникальные. Часто такие сведения могли бы облегчить поиск информации и работу с делами другим исследователям. Но из-за того, что нет возможности централизованно сохранять и делиться наработками, разные пользователи могут проделывать параллельно одну и ту же работу, а кто-то или тратит на поиски лишнее время, или совсем не может найти то, что ищет.
Для того чтобы появилась возможность обобщать, систематизировать и делиться наработками в упомянутой выше гугл-таблице я создал еще один лист. Второй лист этой таблицы (примечания к делам) отличается от первого листа и служит для других целей. На этом листе указываются номера фонда/описи/дела и "примечание" к делу. Примечание не путать с описанием.
Примечания из этого листа будут присоединятся в экселевих файлах к существующим описаниям с сайта ЦГАМ или базы НСА. Это не замена описаний, а именно дополнение к описаниям. По этой причине просьба делать примечания компактными и указывать в них только основные важные детали, которые отсутствуют в описании на сайте ЦГАМ. Как это будет выглядеть показано на скриншотах.
Что может быть в "примечании"? Это любая информация, которая может быть полезна пользователям (себе в том числе) и которая отсутствует в описаниях дел на сайте ЦГАМ. Например, встречаются дела, которые не в точности совпадают с описью, которые могут отличаться даже от бумажной описи. В каком-то деле могут быть отсутствующие страницы или может быть не упомянутая церковь, в отдельных делах могут быть случайные вставки из других дел. Где-то может отсутствовать заявленная в описи церковь. Где-то может быть нарушена очередность листов итп. Я думаю, что многие встречали такие дела. Также можно указать номера страниц по церквям или по годам. Можно указывать только номера начальных страниц по церкви, а можно указывать по три номера страниц для каждой церкви (для I,II,III частей). Также на сайте ЦГАМ в описаниях иногда встречаются неточности. Конечно, лучше попросить архив поправить эти неточности, но не всегда их оперативно исправляют и тогда помогут новые примечания.
Заполняются записи с примечаниями к делам очень просто. Вводите номер дела и в соседней колонке сам текст примечания. При заполнении для одной записи текст пишите в одной строке, без переносов текста на другие строки. Само содержание примечание должно дополнять основное описание, а не повторять его. Ячейка с со ссылкой на сайт ЦГАМ служит только для удобства. Лучше ее заполнить, но это не обязательно. На третей странице гугл-таблицы добавил краткую памятку по основным моментам заполнения.
Все добавленные вами примечания попадут в два типа таблиц. 1. Таблицы со списком метрических книг/исповедок/сказок. 2. Мегатаблица (совмещенные данные из НСА и с сайта). В начале февраля я ее выкладывал, но позднее будет большое обновление. Кроме того ваши примечания доступны и просто по ссылке на гугл-таблицу, и любой при необходимости может использовать их "в ручном режиме" или подключить к автоматизированным обработкам.
Обратите внимание, что можно заполнять "примечания" даже для тех дел, которые есть в базе НСА, но не выложены на сайт в раздел "Моя семья". Эти примечания будут копироваться в "мегатаблицу", а если дело выложат на сайт, то примечание скопируется и в другую таблицу.
Программную часть я уже реализовал. Для примера заполнил несколько строк. В следующем сообщении в этой теме, в обновлении экселевских файлов все "примечания" пользователей из гугл-таблицы уже были автоматически присоединены.