На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
По результатам обработки страниц второго дела сделал для себя такие наблюдения:
- набор имен родственников носителей фамилий для данных документов всё таки имеет смысл (хоть я и писал обратное) для того, чтобы проконтролировать число переписанных по итоговым записям и, тем самым, убедиться, что листы/тетради не перепутаны
- у соседних записей часто встречаются чуть отличающиеся фамилии (например, "Винокур" и "Винокуров") без указания родства; я бы сделал (бездоказательное) предположение, что первый - отец второго
- через час работы начинаются ошибки, "глаз замыливается" - надо делать перерывы; в связи с этим же, очень желательна независимая вычитка набранных текстов (моих - точно); может кто-нибудь захочет в нашем процессе поучаствовать такого рода деятельностью?
По-поводу технологии набора, есть такие, так сказать, "свежие" рекомендации:
1) Персон все таки набирать в порядке, как представлено в документе, т.е. имя - фамилия (не надо задумываться о перестановке) Исключения: - руководящий состав, т.е. то малое кол-во записей, у кого указана должность и т.п.; т.к. программно потом поменять местами Ф и И у таких записей будет немного сложнее, то быстрее их сразу завести в "правильном" виде Петров Сидор,начальник - у всех родственников по отношению к "офамиленной" записи набирать только имена (брат/сват - НЕ набирать) - у подряд идущих однофамильцев фамилию набирать только у первого - у первого "безфамильного" родича на странице набивать фамилию с предыдущей записи
2) Уверенное, но не очевидное прочтение помечать - "Борыс(!)" Неуверенное прочтение помечать - "Гюльчатай(?)" Пропуск в слове (пока всего пару раз мне встретился) помечать "Пе[...]ров" или дополнять по смыслу "Пе[т]ров" 3) Можно оставлять имена/фамилии "как есть", но можно совсем уж ныне изменившиеся смягчать или огрублять (Козма >>> Козьма) 4) Окончания нередко здесь "потеряны" - я их дописывал (Загуменно >>> Загуменной)
5) титульные записи заводить "как в документе", но со специальным символом в начале строки (одно тире; -слобода Слободка) 6) сведения об итогах - парой строк (с местоположением и с итоговой цифрой); тоже с тире в начале строки 7) несколькими тире в начале строки вводить примечание (например, ---предположительно разрыв текста, т.к. резкая смена почерка) 8) оставлять пустую строку между страницами и перед/после заголовков/итогов - так легче потом вычитывать при проверке
Ещё раз повторюсь, что это - рекомендации. По ним лично мне работать проще и быстрее.
Для присоединяющихся... - не ждите, когда Вам скажут "берите листы XXX-YYY"; читайте свежие сообщения и берите следующие по-порядку, отписавшись при этом здесь - берите ЛЮБОЕ кол-во листов для набора - какое Вам комфортно - если кто-то решит заняться выверкой - мне кажется, было бы правильно, брать набранные файлы целиком - т.е., есть, например, файл 1234-1244.txt >> проверять только 5 страниц из него - это усложнять процесс; лучше уж поднапрячься но просмотреть весь
Я в последнее время при индексации набираю текст в простом Notepad++ (его замечательное св-во - он автоматически сохраняет набранное и работа не пропадет даже при случайном закрытии программы, выключении эл-ва и т.п.)
Набираю текст максимально компактно:
1) для заголовков (например, новый нас. пункт) в первой позиции "тире", запятая, лист, "о" для оборота, запятая, заголовок
-111о,деревня Гадюкино
2) для облегченного указателя - только фамилии
112,Иванов
3) для расширенного - ФИО через пробел (если какого-то элемента нет, пробел желательно сохранять)
113о,Петров Сидор Емельянович 114,(?) Анна Борисовна 114, Анна Борисовна 114,Иванов Григорий
4) для совсем широкого варианта - ещё одна запятая и далее все подряд
115,Павлов Пал Палыч,дожил до 111 лет(!)
Готовый в таком виде текст (реальный пример можно посмотреть в прикрепленном файле здесь) за, от силы, пару часов с помощью макросов преобразуется во вполне приличные, имхо, указатели - структура документа, географический, фамильный и/или глав семейств.
Если кто-то решит набирать по такому варианту - я берусь преобразовать его результат к любому требуемому
Так же, из общих соображений... Мне кажется, что набор имен сыновей особого смысла не имеет. Мы же хотим указатель? Или все таки сплошной текст документов? Я не возражаю - буду делать как скажете Но мне жалко нашего времени. Всё равно человек пойдёт смотреть картинки, а искать будет по фамилии.
Piligrim12, Вас добавил. Я тоже только на следующей неделе сделаю, так как сейчас в командировке. Формат по сути не важен, главное, чтобы понятно было что откуда, а собрать потом можно хоть из экселя, хоть из ворда. codenz, уточните, пожалуйста, какие фотографии Вы берете. 1390 - это не начало второго дела. Важно понимать, чтобы другие не делали эту же работу. Напишите конкретные номера 1390 - ?
[/q]
с Калачеевской сотни 1390 по 1409. раз беру лист 1390 то напишу его весь. чтобы не путать других
>> Ответ на сообщение пользователя bibliophile от 13 марта 2023 20:50
... расскажите окончательно, как индексируем))
[/q]
Мне кажется, что можно набирать в любом виде, какой кому нравится, но при одном условии - есть чёткое понимание, что из выбранного Вами формата можно относительно простыми операциями получить требуемый.
А вот с "требуемым" надо бы определиться заранее.
Варианты codenz и bibliophile - практически полный текст. Из таких можно сделать любую "выжимку". Мои варианты - это уже частичная потеря данных, но экономия времени. "Что в одном месте убудет, то в другом прибудет"
Vasilii Milashenko, falcon8, добавил номера фото для Вас. a-KaDeMi-k, Вам отметить фото? Набирать можно как угодно. Я тоже было сначала предложить хотел вариант как у codenz, он чуть проще, но он не позволяет отсортировать по фамилиям. А это бывает важно, когда есть варианты прочтения и т.п., все их в поиск не вобьешь, что-то может потеряться. В моем понимании свести весь текст потом в один файл и задать при необходимости сортировку по фамилиям. И будет видны все варианты похожих фамилий. Но я не настаиваю. Давайте просто как-то договоримся, чтобы потом при общем сведении было меньше работы и файлы были собраны похожим образом. Одно лишь мне видится важным - брать информацию по-максимуму, документ и так "пустой", поэтому я бы не сокращал то, что есть. Важны - номер листа, фамилия, имя. Чтобы потом можно было легко найти нужное фото. Мое предложение остается в силе - фамилию ставить на первое место. И я бы взял ворд, а не эксель с точки зрения скорости набора, чтобы не разбивать фамилии и имена по разным ячейкам.
--- Интересует любая информация о Сумском слободском полке; с. Осоевка Миропольского уезда XVII - середина XVIII в.; сл. Николаевская Камышинского уезда Саратовской губ. 1740-1770 гг.; с. Синеоковка Золотоношского уезда до 1890-х гг.; с. Червленоразное (Песчанка) Царицынского уезда Саратовской губ.
Коллеги, неоднократно упоминалось что есть 5 дел . Реквизиты 4-х мы нашли. Кто признается какие реквизиты у пятого дела? По сумме листов как раз не хватает чуть больше сотни.
falcon8 в моем первом сообщении список, напротив Вашего ника стоят номера фото. falcon8 фото 1546 - 1555
--- Интересует любая информация о Сумском слободском полке; с. Осоевка Миропольского уезда XVII - середина XVIII в.; сл. Николаевская Камышинского уезда Саратовской губ. 1740-1770 гг.; с. Синеоковка Золотоношского уезда до 1890-х гг.; с. Червленоразное (Песчанка) Царицынского уезда Саратовской губ.
Пока на меня не бронируйте, чтобы разрывов не было. Постараюсь подключиться ближе к выходным.
Если всё таки мы решили набирать и сыновей,
то я, скорее всего, буду набирать в таком формате:
111о (один раз в начале страницы; "о", "об" или "об." - без разницы; литерные страницы лучше заглавными - 111Ао) -деревня Гадюкино (шапка, раздел, нас.пункт) Фамилия Имя (для главы семейства без отчества) Фамилия Имя Отчество (для главы семейства с отчеством) Фамилия Имя Отчество,примечание (для лиц, например, с должностью или званием) Имя (для детей) --итог деревня Гадюкино 235 чел (для структуры документа и выявления её нарушения)
Лишнее несущественное - не набирать. Например, строки "дети его". Фамилию детям можно будет подставить программно со строки выше. Но если ребенок идет первым на странице - лучше фамилию набрать повторно.
Из важного и сложного - соблюсти формат. Т.е., поставить первой фамилию, добавить тире для заголовка и два для итога и т.п.
Для текста, набранного codenz это будет выглядеть так
1391 Бондур Влас Шумов Моисей Краснолуцкой Артем ... Зайков(?) Петр (неуверенное прочтение - писать знак вопроса в скобках без пробела после слова) ... 1392 Щербаков Гаврило Ткачев Семен ... Быстрицкий Андрей Павел Остап Федор Хемичев Григорий ... Шевцов Михайло Алексей Моисей Захарченков Федор Василей Илья Зюбенко Павел Винокуров Григорий Григорий Иван Василей Василей,меньшой Науменко Иван ...
Набранный в таком формате текст я потом преобразую к табличному виду, а далее можно делать указатели или фильтрацию, поиск в Excel
лист / Фамилия / Имя / звание-должность 1392 / Шевцов / Михайло 1392 / Шевцов / Илья 1392 / Шевцов / Моисей