ВГД требуется ведущий (админ)   [х]
Всероссийское Генеалогическое Древо
На сайте ВГД собираются люди, увлеченные генеалогией, историей, геральдикой и т.д. Здесь вы найдете собеседников, экспертов, умелых помощников в поисках предков и родственников. Вам подскажут где искать документы о павших в боях и пропавших без вести, в какой архив обратиться при исследовании родословной своей семьи, помогут определить по старой фотографии принадлежность к воинским частям, ведомствам и чину. ВГД - поиск людей в прошлом, настоящем и будущем!
Вниз ⇊

Создание именного и географического указателя


← Назад    Модератор: abv
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771
https://www.personalhistory.ru/ukaz.html
Последнее изменение 16.10.2021 17:18:32 (см. актуальную версию

1. Выберите текстовый файл. 2. Создайте указатели. 3. Сохраните результат.
Расширение в наименовании файла не проверяется. Подходящие расширения: txt, csv, htm, html и другие. Главное, чтобы содержимым файла был текст который можно прочесть, скажем, в блокноте (при этом расширения pdf, djvu, doc, docx не подходят, поскольку имеют не текстовый формат).
Кодировка utf8 предпочтительна. Текст может содержать буквы дореволюционного алфавита: ѣіѵѳѢІѴѲ.
Имена и фамилии (в таком порядке) распознаются по двум или трем последовательным словам, записанным с заглавной буквы. Имя и отчество могут быть представлены в форме инициалов.
Населенные пункты распознаются по двум или трем последовательным словам, первое из которых - тип (село, город или деревня), записанный как в полной форме, так и в сокращении:
['с.','село','села','селѣ','Села'] унифицируются в указателе до 'с'.
['г.','город','города'] унифицируются в указателе до 'г'.
['д.','деревни','деревнѣ'] унифицируются в указателе до 'д'.
Указатели сортируются по второму слову.
Файл сохранится в папке Downloads под тем же именем, с добавлением (через пробел) к имени слова 'ukaz', и расширением html.

Пожелания и замечания по поводу этой программы принимаются с благодарностью по адресу info@personalhistory.ru
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771

Новый проект. Кросс-таблица упоминаний персон.

Дано: список ссылок или материалов, содержащих упоминания персон.
Требуется: составить таблицу, где по строкам расположены персоны, по столбцам источники, а на их пересечении - признак наличия упоминания персоны в источнике.

Пример: преподаватели Варшавского ИБД на 1874, 1891-1895, 1897-1914 https://personalhistory.ru/images/Varshava.htm
Начал вручную делать, см. "Алфавит преподавателей" https://personalhistory.ru/images/Varshava.htm#alfavit
Оказалось утомительно, на полпути остановился.

Чтобы не мучаться в одиночку, буду привлекать Питон для этого - на пару веселее.

Получилась такая программа:

import re
from sortedcontainers import SortedDict
with open('c://personalhistory.ru/www/images/Varshava.htm', encoding = 'utf-8') as f:
contents = f.read()
start = contents.find('name="prep"')
end = contents.find('id="alfavit"')
r = re.findall(r"<strong>([0-9]+|[А-ЯЁѲІѢ][а-яѳіѣ]+)</strong>",
contents[start: end])
years = set()
cross = {}
for it in r:
if re.match('[0-9]+$', it):
year = it
years.add(year)
else:
cr = cross.get(it)
if cr:
cross[it].append(year)
else:
cross[it] = [year]
years_sorted = list(years)
years_sorted.sort()
cross_sorted = SortedDict(cross)
with open('c://temp/cross.html', 'w', encoding='utf-8') as g:
g.write('<meta charset="utf-8">\n<table border=1>\n')
s = "<tr><td>Name</td>"
for y in years_sorted:
s += f"<td>{y}</td>"
s += '</tr>\n'
g.write(s)
for person in cross_sorted:
s = f"<tr><td>{person}</td>"
for y in years_sorted:
if y in cross_sorted[person]:
s += f"<td>{y}</td>"
else:
s += '<td></td>'
s += '</tr>\n'
g.write(s)

Программа берет часть текста, начинающуюся с name="prep" и заканчивающуюся id="alfavit" (это участок, на котором приведены выписки из памятных книжек за разные годы, со сведениями о препод. составе).
Предполагается, что сведения каждого года начинаются с номера года, заключенного в скобки <strong></strong>. Также предполагается, что фамилии персон, перечисленных в списке данного года, выделены в тексте теми же скобками <strong></strong>.
Таблица получается следующая:
Name1874189118921893189418951896189718981899190019011902190319041905190619071908190919101911191219131914
Іогансонъ1891189218931894189518971898
Авенаріусъ1874
Алексѣева1895189718981899
Альбаумъ1898190419051906190719081909
Артамонова1898
Базинеръ190419051906
Бекманъ189819041905
Бонфисъ187418911892189318941895
Браунъ1911191219131914
Бруевичъ189318941895
Будиловичъ1891189218931894189518971898189919001901190219031904190519061907190819091910
Булашевъ1905190619071908190919101911191219131914
Бурше18911892189318941895189718981899190019011902190319041905
Бѣляновскій1891
Васво189819031904190519061907190819091910191119131914
Васьо1912
Вержбовская1874
Витовская1874
Власенко1905190619071908190919101911191219131914
Войткевичъ19001901190219041905190619071908190919101911191219131914
Воткевичъ1903
Врублевскій18911892189318941895189718981899190019011902
Гапоновъ189118921893189418951897189818991900190119021903
Гевальке1912
Гевельке19091910191119131914
Гевепьке1908
Гейнрихъ1891189218931894189518971898189919001901190219031904190519061907
Говорко1904
Гомолицкая1891189218931894
Горлицына18911892189318941895189718981899190019011902190319041905190619071908190919101911
Гржимская1874
Гурскій1905190619071908190919101911191219131914
Гутманъ191219131914
Дегіо1905190619071908190919101911191219131914
Дзерожинская1874
Дмитріева19041905190619071908190919101911191219131914
Добровольская1874
Добровольскій19041905190619071908190919101911191219131914
Доможирова189819041905
Дурасова1911191219131914
Енакіева1874
Ертель1897
Иванова1874
Калистовъ1898
Каллистовъ1892189318941895189718981899190019011902
Камоцкій190319041905190619071908190919101911191219131914
Каня1874
Кардашевская190419051906
Карнѣевъ189118921894189518981899190019011902190319041905190619071908190919101911191219131914
Катанская19071908190919101911191219131914
Качаупова1898
Качинская1874
Кладиновъ190519061907190819101911191219131914
Ковалевская1874
Козьминская1874
Колонтаевская191119121914
Корецкій1874
Корнѣевъ18931897
Коханская1874
Кригеръ18971898189919001901190219031904
Крохинъ19041905
Ксенская1874
Кузнецовъ190819091910191119121913
Кургановичъ19031904190519061907190819091910191119121913
Курелля1874
Курпевская1911191219131914
Левашевъ1874
Лепина1874
Лотъ190619071908190919101911191219131914
Лужицкій1910
Лукьяновъ1891189218931894
Люкъ1874
Мазуркевичъ1895189718981899190019011902190319041905190619071908190919101911191219131914
Маловъ189518971898189919001901190219031904190519061907190819091910191119121913
Маляновская1874
Мамаева1874
Мансюи19041905190619071908190919101911191219131914
Марешъ1914
Марчевская1902190319041905190619071908190919101911191219131914
Матвѣевъ19041905190619071908190919101911191219131914
Мей1874
Мингеймеръ18911892
Минхгеймеръ1874
Михаловскій18911892189318941895189718981899190019011902190319041905190619071908190919101911191219131914
Москвинъ19131914
Мысына1914
Николаева189518971898
Никольскій1905190619071908190919101911191219131914
Новаковскій190919101911191219131914
Огнева190419051906190719081909
Олехновичъ18991900190119021903190419051906
Палинская189819041905190619071908190919101911191219131914
Пасенко190819091910191119121913
Паулюсъ1904
Пацевичъ1891189218931894
Петерсенъ1898190919101911191219131914
Петрова1874
Плонскій1874189118921893189418951897189818991900190119021903
Позняковъ1905190619071908190919101911191219131914
Покровскій19131914
Полторацкая190419051906190719081909191019111912
Полянская1874
Попкова1898
Потапьева189819041905190619071908190919101911191219131914
Прухницкая1874
Револинская18981904190519061907
Рейхель1874
Рейхеръ189118921893189418951897
Реянковская1909
Ритта1874
Рожановичъ1903190419051906
Романовъ1906
Ружицкій1893189418951897189818991900190119021903190419051906190719081909191119121913
Савицкая19041905190619071908190919101911191219131914
Селицкая1874
Синайскій19131914
Скарятина190219041905190619071908190919101911191219131914
Скварковскій1898
Скорятина1903
Славинская1874
Слупецкая1874
Случевская1874
Смирнова18911892189318941895189718981899190019011902190319041905190619071908190919101911191219131914
Созановичъ190819091910
Соколова19131914
Софроницкій1904190519061907190819091910191119121913
Станкевичъ1911191219131914
Степановичъ1874
Стефановичъ1874
Стефанъ1914
Сувака19131914
Судравская190419051906
Сысоева1898
Сятковскій1904
Товстолѣсовъ1902
Товстолѣсъ18911892189318941895189718981899190019011903190419051906
Туголѣсовъ19111912
Урбановичъ1874
Феоктистовъ1898
Филонова18911892189318941895189718981899190019011902
Фіалковская19111913
Фіялковская19121914
Циндлеръ189819041905190619071908190919101911191219131914
Цишевскій19001901190219031904190519061907
Шапюи19041905190619071908190919101911191219131914
Шепетовская1874
Шлецеръ1891
Шуховъ1874
Щедродарова191219131914
Эльмановичъ1913
Энглишъ18911892189318941895189718981899190019011902190319041905190619071908
Эртель189118921893189418951898189919001901
Юркевичъ19041905190619071908190919101911191219131914
Яблонскій1891189218931894
Ѳеоктистовъ189118921893189418951897189818991900190119021903
На мой взгляд,получилось удовлетворительно.
Наглядно видно, что в источниках есть огрехи:
  • "Гевальке" и "Гевепьке" на самом деле, похоже, это "Гевельке"
  • Сложнее случай с "Каня", хотя по кросс-табилце этого не скажешь. В 1874 их было двое: Эммануилъ Урбанов. Каня и Адамъ Урбанов. Каня. Поскольку фамилия одна, людей двое, а скобками в источнике выделяется только фамилия, то этих сиамских близнецов различить не удается. Это вина не программы, а способа разметки источника.
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771
И еще раз об ней, об "Кросс-таблице", будь она ладна (ладнее, чем во времена оные)
Добавил в разметку источников к фамилиям также имена и отчества.
Образец (для упрощения форматирования в этом сообщении заменил угловые скобки на выделение жирным):
Было Стало
Витольдъ Ант. Врублевскій Витольдъ Ант. Врублевскій
Сортировку программа по-прежнему делает по фамилии, но теперь фамилия - это часть выделения справа до первого пробела.
Сиамских близнецов Каня теперь удалось разделить.
Но проявилось следующее явление (Христа народу):
94Павл. Дмитр. Каллистовъ189218931897
95Павелъ Дмитр. Каллистовъ18941895
96Павелъ Дмитріевичъ Каллистовъ1898
Для борьбы с этим явлением понадобилось завести стандартизацию (словарь замен) - напр., все эти три упоминания относим к одному из них.
Но враг не сдается. Значит, его утилизируют. Самогоноварение у нас из жита. Не изжито пока такое стихийное явление, как смена фамилии.
Пример:
63 Елисавета Степ. Бруевичъ189318941895
109 Елисавета Степ. Кригеръ1897189818991900
110 Елисав. Степ. Кригеръ1901
111 Елисав. Степан. Кригеръ190219031904
Пришлось учесть (в словаре замен) смену фамилии следующим образом:
Найти Заменить на
Елисавета Степ. БруевичъЕлисавета Степ. Бруевичъ(1897:Кригеръ)
Елисавета Степ. КригеръЕлисавета Степ. Бруевичъ(1897:Кригеръ)
Елисав. Степ. КригеръЕлисавета Степ. Бруевичъ(1897:Кригеръ)
Елисав. Степан. КригеръЕлисавета Степ. Бруевичъ(1897:Кригеръ)
Полюбоваться на результат можно здесь: https://personalhistory.ru/images/Varshava.htm
Кросс-таблицу можно воочию наблюдать здесь https://personalhistory.ru/images/Varshava.htm#cross
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771
Что мы ломимся в давно открытую дверь, ей богу! Хотел я сказать..
Товарищ В.П. Степанов ажно в 2003 г. книгу издал "Русское служилое дворянство второй половины 18 века (1764-1795)".
Молодец, право слово: составил он Кросс-таблицу упоминаний персон из "Месяцослова с росписью чиновных особ" 1764-1795
Таблица получилась хоть куды - 36571 строк (персон) и 32 колонок (по числу месяцословов).

Одно только смущает и гложет - кросс-таблица есть, а вот текстов самих месяцословов нет. А мне кажется - сказал "А", говори и "Б". Тем более, и времени утекло с этого 2003 г. немало уже.

Короче, взял я (за жабры) список месяцословов 18 века
[q]

1727_Kalendar_mesyceslov.pdf
1728_Kalendar_mesyceslov.pdf
1729_Kalendar_mesyceslov.pdf
1731_Kalendar_mesyceslov.pdf
1733_Kalendar_mesyceslov.pdf
1734_Kalendar_mesyceslov.pdf
1735_Kalendar_mesyceslov.pdf
1745_SPb_kalendar.pdf
1747_SPb_kalendar.pdf
1748_SPb_kalendar.pdf
1765_Adres_kalendar_Rossiyskiy.pdf
1766_Adres_Kalendar_Rossiyskiy.pdf
1767_Adres_kalendar_Rossiyskiy.pdf
1772_Mesyceslov_Rossii.pdf
1773_Mesyceslov_Rossii.pdf
1775_Mesyceslov_Rossii.pdf
1777_Mesyceslov_Rossii.pdf
1778_Mesyceslov_Rossii.pdf
1779_Mesyceslov_Rossii.pdf
1780_Mesyceslov_Rossii.pdf
1781_Mesyceslov_Rossii.pdf
1782_Mesyceslov_Rossii.pdf
1783_Mesyceslov_Rossii.pdf
1784_Mesyceslov_Rossii.pdf
1785_Mesyceslov_Rossii.pdf
1786_Mesyceslov_Rossii.pdf
1787_Mesyceslov_Rossii.pdf
1788_Mesyceslov_Rossii.pdf
1789_Mesyceslov_Rossii.pdf
1790_Mesyceslov_Rossii.pdf
1791_Mesyceslov_Rossii.pdf
1792_Mesyceslov_Rossii.pdf
1793_Mesyceslov_Rossii.pdf
1794_Mesyceslov_Rossii.pdf
1795_Mesyceslov_Rossii.pdf
1796_Mesyceslov_Rossii.pdf
[/q]

и говорю: а ну-ка, давай-ка, плясать выходи. В смысле - покажи-ка личико, в виде текста.
Ау-ау, нет ответа. Ни гу-гу, ни тпру, ни ну.
Ну взял я себя в руки, а в руки взял месяцослов 1788, для примеру и для острастки, чтоб другим неповадно было (отмалчиваться).
Пригладил страницы в pdf, разделил, повернул (на свет, )присмотрелся - а ведь текст-то вполне даже доступен индексации.
За неделю набил 150 страниц из 396. Через пару недель, стало быть, закончу эту работу и вывешу тогда на своем сайте весь текст, как он есть, от корки до корки.
[q]
МѢСЯЦОСЛОВЪ СЪ РОСПИСЬЮ ЧИНОВНЫХЪ ОСОБЪ ВЪ ГОСУДАРСТВѢ, НА ЛѢТО отъ рождества христова 1788.
ВЪ САНКТПЕТЕРБУРГѢ, при Императорской Академіи Наукъ.
РОСПИСЬ ЧИНОВНЫХЪ ОСОБЪ ВЪ ГОСУДАРСТВѢ
При началѣ сего 1788 года.
ЕЯ ИМПЕРАТОРСКАГО ВЕЛИЧЕСТВА СОВѢТЪ:
Графъ Кирила Григорьевичъ Разумовскій, Генералъ-Фельдмаршалъ, ЕЯ ИМПЕРАТОРСКАГО ВЕЛИЧЕСТВА Генералъ-Адъютантъ, Сенаторъ, Санктпетербургской Императорской Академіи Наукъ Президентъ, дѣйствительный Камергеръ, Лейбгвардіи Измайловскаго полку Подполковникъ и орденовъ Россійскихъ св. Апос. Андрея и св. Александра Невскаго, Польскаго Бѣлаго Орла и св. Анны Кавалеръ.

Графъ Петръ Александровичъ Румянцовъ-Задунайскій, Генералъ-Фельдмаршалъ, Сенаторъ, Кіевскій, Черниговскій и Новгородскій-Сѣверскій Генералъ-Губернаторъ, Лейбгвардіи коннаго полку Подполковникъ, Кирасирскаго полку военнаго ордена св. Великомуч. и побѣдоносца Георгія Полковникъ, и орденовъ Россійскихъ св. Апостола Андрея, св. Алекс. Невс., св. Георгія 1-го класса и св. равноапос. Князя Владимира 1-й же степ., Прусскаго Чернаго Орла и св. Анны Кавалеръ.

Князь Григорій Александровичъ Потемкинъ-Таврическій, Генералъ-Фельдмаршалъ, командующій всею легкою конницею регулярною и нерегулярною, флотомъ Черноморскимъ и многими другими сухопутными и морскими силами, Государственной Военной Коллегіи Президентъ, ЕЯ ИМПЕРАТОРСКАГО ВЕЛИЧЕСТВА Генералъ-Адъютантъ, Екатеринославскій, Таврическій и Харьковскій Генералъ-Губернаторъ, Кавалергардскаго Корпуса и Екатеринославскаго Кирасирскаго полку Шефъ, Лейбгвардіи Преображенскаго Полку Подполковникъ, дѣйствительный Камергеръ, войскъ Генералъ-Инспекторъ, Мастеровой и Оружейной палаты Верховный Начальникъ, разныхъ Иновѣрцовъ обитающихъ въ Россіи, по Комиссіи новосочиняемаго Уложенія Опекунъ, орденовъ Россійскихъ св. Апос. Андрея, св. Алекс. Невс., военнаго Великомученика Георгія и св. равноапос. Князя Владимира большихъ Крестовъ, Прусскаго Чернаго Орла, Датскаго Слона, Шведскаго Серафима, Польскихъ Бѣлаго Орла и св. Станислава и св. Анны Кавалеръ.

Графъ Иванъ Григорьевичъ Чернышевъ, Сенаторъ, Государственной Адмиралтейской Коллегіи Вице-Президентъ, въ Галерномъ флотѣ и надъ Портомъ Главный Командиръ,

.... [Продолжение следует]
[/q]


Может, есть (или если нет, то, может, появятся) желающие присоединиться к банкету?
Возьмем, поделим все 36 томов меж собой, да и быстренько сбацаем это дело.
Тогда у нас появится не только возможность проверить книгу Степанова на соответствие, но и к каждой его строчке присоединить ссылку на соответствующую строку текста соответствующей книги (у него, правда, не все года из намеченной мной программы действий; справедливости ради, у меня тоже перечень не полный) - и тогда наверняка вдруг запляшут облака, а может статься, и кузнечик запиликает на скрипке.
Вы ж, небось, кузнечика со скрипкой не видали пока. А так, шанс будет.
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771
Не помню, говорил ли я вам, что месецословом вдруг занялся? Ах да, говорил, конечно. Это же в предыдущем моем сообщении подробно изложено..
Новый проект "Parser of historical texts"
Берем, значится, какой-нибудь исторический текст. Да вот, хотя бы и месяцослов 1788 (не весь, конечно, весь он большой больно - а только выверенную его часть - сейчас это первые 177 страниц, по внутренней нумерации - стр.1-151).
Вот, например, как выглядит последняя из этих страниц - 151-ая
[q]

ЯРОСЛАВСКОЕ НАМѢСТНИЧЕСТВО. 151

Въ дворянской Опекѣ: Предводитель — Надв. Сов. Николай Александровичъ Неболсинъ.

Въ уѣздномъ Казначействѣ: Казначей — Провинц. Секретарь Петръ Протопоповъ.

Въ нижнемъ Земскомъ судѣ: Исправникъ — Порутч. Василій Поповъ; Засѣдатели: Порут. Василій Неболсинъ, Подпорутч. Василій Лавровъ; Секретарь — Коллеж. Регистраторъ Павелъ Ватолинъ.



ВЪ ЯРОСЛАВСКОМЪ НАМѢСТНИЧЕСТВѢ:

Въ Намѣстническомъ Правленіи:

Генералъ-Губернаторъ — Алексѣй Петровичъ Мельгуновъ, Дѣйствит. Тайный Совѣтникъ. См. стр. 17.

При немъ: Адъютанты: Порутч. Тертій Степановъ сынъ Борноволоковъ, Коллеж. Регистр. Тимоѳей Алексѣевъ сынъ Бутримовъ; Секретарь — Коллеж. Ассес. Василей Семеновичъ Сахаровъ.

Въ должности Правителя — Генералъ-Маіоръ Иванъ Ивановичъ Голохвастовъ.

Совѣтники: Над. Совѣт. Михайло Антоновичъ Шишковъ, Коллеж. Ассес. Николай Степановичъ Карновичъ; Секретарь — Коллеж. Николай Степановъ сынъ Писаревскій.

ВЪ ПАЛАТАХЪ:

Уголовнаго Суда:

Предсѣдатель — Стат. Совѣт. Лука Андреевичъ Михайловъ; Совѣтники: Надвор. Совѣтники: Иванъ Петровичъ Голенищевъ-Кутузовъ и Петръ Михайловичъ Апочининъ; Ассессоры: Над. Совѣт. Аркадій Ивановичъ Толбугинъ, Гвардіи Прапорщикъ Павелъ Ивановъ сынъ Нестеровъ; Секретарь — Коллеж. Степанъ Ивановъ сынъ Поповъ.

Гражданскаго суда:

Предсѣдатель — Стат. Совѣт. Николай Ивановичъ Аксаковъ; Совѣтники: Коллеж. Совѣт. Ѳедоръ Петровичъ Векентьевъ, Подполковникъ Сергѣй Петровичъ Шишкинъ; Ассессоры: Коллеж. Ассес. Михайло Аѳанасьевичъ Коловской, Капитанъ Петръ Мироновъ сынъ Ушаковъ; Секретарь — Губерн. Семенъ Ѳедоровъ сынъ Мухинъ.

Въ Казенной:

Правящій должность Вице-Губернатора — Дѣйствит. Стат. Совѣт. и ор. св. Владим. 3 степ. Кавалеръ, Князь Никита Сергѣевичъ Урусовъ; Экономіи Директоръ — Надвор. Совѣт. Сергѣй Никаноровичъ Кашинцовъ; Совѣтникъ — Над. Совѣт. Алексѣй Алексѣевичъ Гаряиновъ; Губернской Каз-
[/q]

Задача: расставить точки над "и" - доподлинно выяснить, кто конкретно там председатель, кто - ассессор и вообще, наглядно представить, кто есть ху.
Для этого придется с таким понятием познакомиться, как формальные грамматики. Не удивляйтесь уж больно-то, они хотя и в 1788 г., а кое-что в этом деле кумекали, видать, ей-же ей.
В грамматике этой всего 7 буковок: нетерминальный символ TEXT, да 6 литералов: ':', '—', ',', 'и', ';', '.'
Ну что это за язык, скажете вы, о чем на нем можно говорить? Что путного высказать? Ой, не скажите!
Скажем. Скажем, последний абзац страницы на этом языке записанный, выглядит тако:
На канцелярскомНа тарабарском
Правящій должность Вице-Губернатора — Дѣйствит. Стат. Совѣт. и ор. св. Владим. 3 степ. Кавалеръ, Князь Никита Сергѣевичъ Урусовъ; Экономіи Директоръ — Надвор. Совѣт. Сергѣй Никаноровичъ Кашинцовъ; Совѣтникъ — Над. Совѣт. Алексѣй Алексѣевичъ Гаряиновъ; Губернской Каз-
TEXT — TEXT и TEXT , TEXT ; TEXT — TEXT ; TEXT — TEXT ; TEXT
Да уж, можно сказать, лаконичный язык, телеграфный, ничего скажешь.

А вот хорошо бы, посреди пруда чтоб беседка, а в беседке и побеседуем - об этом деле.
В общем, сбацал я программку, передаю, право слово, право слова ей.
Вот результат (конкретно, для этой страницы):
3111Въ дворянской Опекѣ : Предводитель — Надв. Сов. Николай Александровичъ Неболсинъ. .
No errors for that line
{
"Въ дворянской Опекѣ": {
"Предводитель": "Надв. Сов. Николай Александровичъ Неболсинъ."
}
}

3112Въ уѣздномъ Казначействѣ : Казначей — Провинц. Секретарь Петръ Протопоповъ. .
No errors for that line
{
"Въ уѣздномъ Казначействѣ": {
"Казначей": "Провинц. Секретарь Петръ Протопоповъ."
}
}

3113Въ нижнемъ Земскомъ судѣ : Исправникъ — Порутч. Василій Поповъ ; Засѣдатели : Порут. Василій Неболсинъ , Подпорутч. Василій Лавровъ ; Секретарь — Коллеж. Регистраторъ Павелъ Ватолинъ. .
No errors for that line
{
"Въ нижнемъ Земскомъ судѣ": {
"Исправникъ": "Порутч. Василій Поповъ",
"Засѣдатели": [
"Порут. Василій Неболсинъ",
"Подпорутч. Василій Лавровъ"
],
"Секретарь": "Коллеж. Регистраторъ Павелъ Ватолинъ."
}
}

3115ВЪ ЯРОСЛАВСКОМЪ НАМѢСТНИЧЕСТВѢ : .
No errors for that line
{
"ВЪ ЯРОСЛАВСКОМЪ НАМѢСТНИЧЕСТВѢ": ""
}

3116Въ Намѣстническомъ Правленіи : .
No errors for that line
{
"Въ Намѣстническомъ Правленіи": ""
}

3117Генералъ-Губернаторъ — Алексѣй Петровичъ Мельгуновъ , Дѣйствит. Тайный Совѣтникъ. См. стр. 17. .
No errors for that line
{
"Генералъ-Губернаторъ": [
"Алексѣй Петровичъ Мельгуновъ",
"Дѣйствит. Тайный Совѣтникъ. См. стр. 17."
]
}

3118При немъ : Адъютанты : Порутч. Тертій Степановъ сынъ Борноволоковъ , Коллеж. Регистр. Тимоѳей Алексѣевъ сынъ Бутримовъ ; Секретарь — Коллеж. Ассес. Василей Семеновичъ Сахаровъ. .
No errors for that line
{
"При немъ": {
"Адъютанты": [
"Порутч. Тертій Степановъ сынъ Борноволоковъ",
"Коллеж. Регистр. Тимоѳей Алексѣевъ сынъ Бутримовъ"
],
"Секретарь": "Коллеж. Ассес. Василей Семеновичъ Сахаровъ."
}
}

3119Въ должности Правителя — Генералъ-Маіоръ Иванъ Ивановичъ Голохвастовъ. .
No errors for that line
{
"Въ должности Правителя": "Генералъ-Маіоръ Иванъ Ивановичъ Голохвастовъ."
}

3120Совѣтники : Над. Совѣт. Михайло Антоновичъ Шишковъ , Коллеж. Ассес. Николай Степановичъ Карновичъ ; Секретарь — Коллеж. Николай Степановъ сынъ Писаревскій. .
No errors for that line
{
"Совѣтники": [
"Над. Совѣт. Михайло Антоновичъ Шишковъ",
"Коллеж. Ассес. Николай Степановичъ Карновичъ"
],
"Секретарь": "Коллеж. Николай Степановъ сынъ Писаревскій."
}

3121ВЪ ПАЛАТАХЪ : .
No errors for that line
{
"ВЪ ПАЛАТАХЪ": ""
}

3122Уголовнаго Суда : .
No errors for that line
{
"Уголовнаго Суда": ""
}

3123Предсѣдатель — Стат. Совѣт. Лука Андреевичъ Михайловъ ; Совѣтники : Надвор. Совѣтники : Иванъ Петровичъ Голенищевъ-Кутузовъ и Петръ Михайловичъ Апочининъ ; Ассессоры : Над. Совѣт. Аркадій Ивановичъ Толбугинъ , Гвардіи Прапорщикъ Павелъ Ивановъ сынъ Нестеровъ ; Секретарь — Коллеж. Степанъ Ивановъ сынъ Поповъ. .
No errors for that line
{
"Предсѣдатель": "Стат. Совѣт. Лука Андреевичъ Михайловъ",
"Совѣтники": {
"Надвор. Совѣтники": [
"Иванъ Петровичъ Голенищевъ-Кутузовъ",
"Петръ Михайловичъ Апочининъ"
],
"Ассессоры": [
"Над. Совѣт. Аркадій Ивановичъ Толбугинъ",
"Гвардіи Прапорщикъ Павелъ Ивановъ сынъ Нестеровъ"
],
"Секретарь": "Коллеж. Степанъ Ивановъ сынъ Поповъ."
}
}

3124Гражданскаго суда : .
No errors for that line
{
"Гражданскаго суда": ""
}

3125Предсѣдатель — Стат. Совѣт. Николай Ивановичъ Аксаковъ ; Совѣтники : Коллеж. Совѣт. Ѳедоръ Петровичъ Векентьевъ , Подполковникъ Сергѣй Петровичъ Шишкинъ ; Ассессоры : Коллеж. Ассес. Михайло Аѳанасьевичъ Коловской , Капитанъ Петръ Мироновъ сынъ Ушаковъ ; Секретарь — Губерн. Семенъ Ѳедоровъ сынъ Мухинъ. .
No errors for that line
{
"Предсѣдатель": "Стат. Совѣт. Николай Ивановичъ Аксаковъ",
"Совѣтники": [
"Коллеж. Совѣт. Ѳедоръ Петровичъ Векентьевъ",
"Подполковникъ Сергѣй Петровичъ Шишкинъ"
],
"Ассессоры": [
"Коллеж. Ассес. Михайло Аѳанасьевичъ Коловской",
"Капитанъ Петръ Мироновъ сынъ Ушаковъ"
],
"Секретарь": "Губерн. Семенъ Ѳедоровъ сынъ Мухинъ."
}

3126Въ Казенной : .
No errors for that line
{
"Въ Казенной": ""
}

3127Правящій должность Вице-Губернатора — Дѣйствит. Стат. Совѣт. и ор. св. Владим. 3 степ. Кавалеръ , Князь Никита Сергѣевичъ Урусовъ ; Экономіи Директоръ — Надвор. Совѣт. Сергѣй Никаноровичъ Кашинцовъ ; Совѣтникъ — Над. Совѣт. Алексѣй Алексѣевичъ Гаряиновъ ; Губернской Каз- .
No errors for that line
{
"Правящій должность Вице-Губернатора": [
"Дѣйствит. Стат. Совѣт.",
"ор. св. Владим. 3 степ. Кавалеръ",
"Князь Никита Сергѣевичъ Урусовъ"
],
"Экономіи Директоръ": "Надвор. Совѣт. Сергѣй Никаноровичъ Кашинцовъ",
"Совѣтникъ": "Над. Совѣт. Алексѣй Алексѣевичъ Гаряиновъ",
"unknown": "Губернской Каз-"
}

Странным образом, текст во второй колонке компьютеру нравится больше - ведь в нем видна структур? кто где какую должность занимает (пардон, занимал, в свое время).

А вы, извиняюся, за нездоровое любопытство, какого мнения, об этом обо всем?

Да, вы не смущайтеся, говорите, как есть, а уж есть я буду сам. Слава богу, большая ложка у меня завсегда за голенищем, если что.
Вот Дед Мороз спросит (скоро) вас, а что вы думаете об всем об этом. А что вы ответите? Не скажете же, "А вы, уважаемый?".
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771
Любопытствующим - любопытная информация.
20 наиболее популярных фраз тарабарского языка

Tarabars frequency list - total 385 different samples from 3127 lines of text
Count tarabar
820 TEXT : TEXT .
357 TEXT .
340 TEXT , TEXT .
231 TEXT : TEXT , TEXT .
150 TEXT , TEXT , TEXT .
113 TEXT , TEXT и TEXT .
45 TEXT : TEXT — TEXT .
34 TEXT , TEXT и TEXT , TEXT .
34 TEXT : TEXT , TEXT ; TEXT , TEXT .
33 TEXT : TEXT , TEXT ; TEXT : TEXT , TEXT ; TEXT , TEXT .
29 TEXT : TEXT , TEXT , TEXT .
24 TEXT , TEXT , TEXT и TEXT .
21 TEXT и TEXT , TEXT .
19 TEXT , TEXT , TEXT , TEXT .
19 TEXT и TEXT .
18 TEXT , TEXT и TEXT и TEXT .
18 TEXT и TEXT : TEXT .
18 TEXT : TEXT , TEXT ; TEXT , TEXT , TEXT ; TEXT .
18 TEXT : TEXT , TEXT ; TEXT , TEXT , TEXT ; TEXT , TEXT .
16 TEXT : TEXT , TEXT и TEXT .

Кое-какие правила тарабарской орфографии подметил. Смотрите, какие (небольшие) изменения требуется сделать в тексте, чтобы он стал по-тарабарски правильным:
БылоМало ли, что когда было. А надо так:
Въ Совѣстномъ судѣ: Судья, дѣйствит. Стат. Совѣт. Петръ Петровичъ Мельгуновъ; Засѣдатели, Коллеж. Совѣтники Никита Ѳедоровичъ Малышкинъ, Александръ Николаевичъ Хомутовъ.Въ Совѣстномъ судѣ: Судья дѣйствит. Стат. Совѣт. Петръ Петровичъ Мельгуновъ; Засѣдатели : Коллеж. Совѣтники : Никита Ѳедоровичъ Малышкинъ, Александръ Николаевичъ Хомутовъ.
Эх, жаль, двоеточия плохо видно - те, которые после "Засѣдатели" и "Совѣтники". Но вы меня поняли, не так ли?

Будет время, займемся и правописанием (каковы правила правописания и как проверять тарабарский текст на (тарабарскую) правильность. А время будет. Ведь каждый новый год - это новые, новенькие, как с иголочки, 365 совершенно свободных (кажется, до следующей пятницы) дней.
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
abv
Модератор раздела

abv

Красногорск, Моск.обл.
Сообщений: 1922
На сайте с 2004 г.
Рейтинг: 771
Есть и ошибки в моем понимании тарабарского языка (все-таки он мне не родной, я не впитал его с молоком матери, как-никак).
На 3127 строк текста набралось 55 ошибок (учитываются только ошибки, замеченные парсером, более тонкий анализ будет иметь смысл когда подрастут, поднаберутся опыта все элементы триады: описание языка, лексер, парсер.

Вот пьедестал почета (позора?) ошибок тарабарщины (показаны только золото и серебро, все остальные занимают бронзовую ступеньку)
Tarabars in error frequency list
- total 50 different samples from 3127 lines of text
Пьедестал
Частота
Фраза
Пример
Syntax Tree

1 (Золото)
5TEXT : TEXT : TEXT , TEXT ; TEXT , TEXT .
Въ Сергіевскомъ посадѣ : въ нижней Расправѣ : Судья , Надвор. Совѣт. Данила Емельяновичъ Даниловъ ; Секретарь , Григорій Хрулевъ. .

Errors encountered
  • "Въ Сергіевскомъ посадѣ" should be Null or of the type list Въ Сергіевскомъ посадѣ : въ нижней Расправѣ : Судья , Надвор. Совѣт. Данила Емельяновичъ Даниловъ ; Секретарь , Григорій Хрулевъ. . ","



{
"Въ Сергіевскомъ посадѣ": {
"въ нижней Расправѣ": [
"Судья",
"Надвор. Совѣт. Данила Емельяновичъ Даниловъ"
]
}
}


2 (Серебро)
2TEXT : TEXT и TEXT : TEXT , TEXT .
Управляющій Экспедиціею : Стат. Совѣтники и орд. св. Влад. 3 степ. Кавалеры : Баронъ Иванъ Карловичъ фонъ Рейхель , Василій Михайловичъ Хлебниковъ. .

Errors encountered

  • type of the value "Стат. Совѣтники" of dict for the first key "орд. св. Влад. 3 степ. Кавалеры" from keys ['Управляющій Экспедиціею', 'орд. св. Влад. 3 степ. Кавалеры'] is expected to be dict



{
"Управляющій Экспедиціею": "Стат. Совѣтники"
}


"Преступная" фраза - "приступим к анализу".
"Золотая" ошибка (которая встретилась пять раз) - это, на самом деле, поправимо, если чуть подредактировать исходный текст под тарабарские правила.
Вот так:
Було
Лучше бы было, если бы було тако (правда, после драки кулаками не машут..)
(рекомендация собакоуводов)

Въ Сергіевскомъ посадѣ : въ нижней Расправѣ : Судья , Надвор. Совѣт. Данила Емельяновичъ Даниловъ ; Секретарь , Григорій Хрулевъ. .
Въ Сергіевскомъ посадѣ : въ нижней Расправѣ : Судья Надвор. Совѣт. Данила Емельяновичъ Даниловъ ; Секретарь Григорій Хрулевъ. .

А вот с серебром посложнее. Люди тогда, в 1788-м (да и их потомки в нонешние времена, зачастую) не хотели повторяться, пока их не заставят.
В данном случае, оба товарища - и барон, и который не барон - оба два (гуся) оказались одновременно и статскими советниками и кавалерами (хоть куды).
Ну куды крестьянину податься? Вот христианин, вместо повторения регалий и перечислил их один раз, поставил двоеточие и потом перечислил персоны, обладающие этими регалиями.
С крестьянина какой спрос? А нам думать надо, как дальше жить. Ведь в тарабарском языке (как я его породил, так я его понимаю) двоеточие - признак того, что слева от него стоит некий признак, а справа значение или список значений этого признака. А здесь получается признак этот составной, состоящий из двух компонент. Будем думать, как выпутываться из этой ситуации. То ли правила (тарабарского) языка менять, то ли парсеру мозгов добавить (пойти у Гудвина попросить, что ли?).
---
Персональная история русскоязычного мира
http://personalhistory.ru
info@personalhistory.ru
Новости из царской России
Яндекс-дзен https://zen.yandex.ru/id/5eee495659f4f25be9052961
medium.com https://medium.com/me/stories/public
Дневник https://forum.vgd.ru/5623/
---
Комси комса, пока роса
Лайк (1)
← Назад    Модератор: abv
Генеалогический форум » Дневники участников » Дневники участников » Дневник abv » Программа создания глоссария » Создание именного и географического указателя [тема №125392]
Вверх ⇈