Familysearch.org - архивная база мормонов
общие вопросы
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
15 марта 2017 13:51 15 марта 2017 13:53 severinn написал: [q] Нужны программы автоматического преобразования такой информации: не вручную же заносить, в самом деле.[/q]
Нет такой программы на данный момент. Не все поддается автоматизации. Иногда и самим надо поработать. На мой взгляд, программу для распознавания рукописного текста создать невозможно. Это нужно создать искусственный интеллект, нейронные сети. Сейчас Гугл что-то пробует сделать, у них нейронная сеть учится распознавать котиков на фото в Сети. Вот если Гугл что-то придумает через несколько лет - тогда да. А пока что самим придется поработать. Программисты FS постарались, теперь и наш черед что-то сделать. А так нам подавай уже готовое: и микрофильмы, и сканы, и разнообразные индексы. Так не получится. Ничего не мешает нам самим составить разнообразные индексы: для метрических книг, для ревизских сказок. severinn написал: [q] Наша проблема, что госархивы считают генеалогию блажью, мне писали здесь на форуме о том еще летом 2016 молодые бывшие работники архивов. 17 лет назад. архивы не хотели заниматься такими поисками, а сейчас и за деньги не могут, объемы запросов выросли в сотни раз.[/q]
Нашим бы архивам для начала созреть бы до проекта уровня familysearch. То есть, для начала продолжить начатую Генеалогическим обществом штата Юта оцифровку (и публикацию) документов. Потому что проект микрофильмирования так и остался незавершенным. В том же Псковском архиве еще сканировать и сканировать. А еще документы есть в краеведческих музеях (фотокопирование за деньги и очень большие), в ЗАГСах. Отсканировать, собрать базу данных по документам приходов (регионов) с указанием архивных шифров документов, в каком архиве хранится. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
Mask-13 Москва Сообщений: 1117 На сайте с 2015 г. Рейтинг: 1100
| Наверх ##
15 марта 2017 14:00 15 марта 2017 15:34 severinn написал: [q] Нужны профессиональные программы автоматического распознавания рукописного текста 18-19 веков.[/q]
К сожалению, это сложнейшая задача, я не уверен, что она будет когда-нибудь решена. Тут дело даже не в деньгах, а в принципиальной возможности. Читать такой текст по буквам нельзя - многие буквы в скорописи пишутся одинаково (например, нечто в виде современной рукописной И может оказаться И, К, Н, А, О), чтобы их различать, нужно понимать смысл написанного, а дойдут ли до этого когда-нибудь компьютеры... Это либо невозможно, либо мы от этого очень далеки даже в теоретическом плане. severinn написал: [q] наши барыги думают только о своих прибылях[/q]
Пишите в личку, я умею распознавать скоропись 18 века без всяких этих компьютеров --- Участвуйте в народном проекте по индексации метрических книг Санкт-Петербурга! https://forum.vgd.ru/4091/107846/ | | |
Zabellisa следопыт  Москва Сообщений: 11501 На сайте с 2003 г. Рейтинг: 9835 | Наверх ##
15 марта 2017 14:08 Mask-13 написал: [q] предложение платных услуг здесь запрещено[/q]
запрещено, см. правила пользовательского соглашения п. 2.1 2.1. Сайт доступен только для личного использования без извлечения коммерческой выгоды и размещения рекламы своих услуг, если иное не согласовано с Администрацией. Запрещается использовать сайт для <...>, коммерческой рекламы, <...> --- С просьбами о поиске и по темам форума в личку обращаться НЕ НАДО!
Платным архивным поиском не занимаюсь
дневник Zabellisa
| | |
Ульяновск Ульяновск Сообщений: 1099 На сайте с 2011 г. Рейтинг: 1310
| Наверх ##
15 марта 2017 14:12 18 век - скоропись? Скоропись была в 17 веке, и после месяца практики хорошо (бегло) читается. В 18 веке оставались элементы скорописи, но в целом это нормальное, быстро читаемое письмо. | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
15 марта 2017 14:22 severinn написал: [q] ведь потом придется выбросить[/q]
Чего выбросить? Расшифровку документа? Так она уже равноценна самому документу. Разве описи и другой справочный аппарат выбрасывают? Нет, ими пользуются. Так и здесь: расшифровка не пропадет, расшифровками, индексами, различными базами данных будут пользоваться. Документ один раз расшифруют, проверят верность расшифровки (индекса), потом это заносят в базы данных и пользуются уже этой расшифровкой. Посмотрел расшифровку, посмотрел ссылку на исходный документ, посмотрел сам документ. Каждый раз расшифровывать один и тот же документ не станут - зачем? Расшифровка нужна только один раз. Чем ждать искусственного интеллекта от Гугл (да и возможно ли такое в принципе), лучше воспользоваться естественным интеллектом. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
15 марта 2017 14:27 severinn написал: [q] при сканирование необходимо и распознавание и преобразование текста [/q]
Млин, это же не печатный текст! Это рукопись. А она требует принципиально иного подхода. Попробуйте найти какое-нибудь старое письмо (хоть текст на обороте открытки) и распознать его программой. Получится? Уверена, что нет. А ведь там еще текст виден хорошо (если взять подходящую открытку с хорошо сохранившимся текстом). А метрики вы бы видели, какие. Иной раз листы смяты, текст плохо виден, часть текста и вовсе отсутствует из-за повреждений документа. Ну как тут автоматом распознаешь? --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
balt-amber Сообщений: 850 На сайте с 2011 г. Рейтинг: 452
| Наверх ##
15 марта 2017 14:28 Эх, сделали бы окно просмотра побольше, да скорости бы добавили. --- Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
15 марта 2017 14:30 severinn написал: [q] это более неподъемный труд, чем распознавание текста[/q]
Да такую базу данных даже я сделала, своими скромными силами. По Псковской губернии. Там, главное, хорошенько по описям полазить. Утомительно только все это. Кому интересно, она здесь: http://i-nventory.ru/index.php?id=801 --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
paul1914 Сообщений: 332 На сайте с 2013 г. Рейтинг: 152
| Наверх ##
15 марта 2017 14:45 microArt написал: [q] Ну как тут автоматом распознаешь? [/q]
В научном универсальном институте необыкновенных наук (НУИНН) сделали автомат для распознавания древних текстов и скормили ему "повесть временных лет". Умный автомат, обученный "нашими" специалистами, прочитал: "и пришел Рюрик на Русь, а был он из атлантов, что предки русичей, а владел землями от Большой Воды на западе до Малой Воды на востоке"... | | |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2489 | Наверх ##
15 марта 2017 15:01 paul1914 написал: [q] В научном универсальном институте необыкновенных наук (НУИНН) сделали автомат для распознавания древних текстов и скормили ему "повесть временных лет". Умный автомат, обученный "нашими" специалистами, прочитал: "и пришел Рюрик на Русь, а был он из атлантов, что предки русичей, а владел землями от Большой Воды на западе до Малой Воды на востоке"... [/q]
Прошу прощения за оффтоп. Но после знакомства с некоторыми историческими теориями еще и не такое напишешь. Всем любителям альтернативной истории посвящается. Нам помнится, Варуне, А может, и Перуну, А может, Вицлипуцли Однажды повезло: Спустилась к ним тарелка, Там человечки с Марса, А может, быть с Антареса – Но это всё равно. В тарелку он поднялся, А может, не поднялся, А может, в пирамиду С разбегу взобрался, И там составить Веды И зодиак ацтекский, А может, Камасутру Спокойно собрался. Тут арии скакали, А может, не скакали, А может, это Сталин злой, А может, и не злой, А может, это Чингисхан, Он шёл по сельской местности, К ближайшему Визáнтию За новою ордой. - Послушайте, Варуна, А может быть, и Цезарь, А может, Клеопатра, Но тоже хороша. У вас такие руны, Календари друидов, Такие мегалиты – И добрая душа. И если вы напишете, На огаме «Ригведу» А может, и споёте – Ведь огам же поют? То вам большую книгу, А может, монографию, Бесплатно сразу тиснут, А может, издадут. Наивный Вицлипуцли, А может быть, Варуна, А может быть, и Цезарь Как что-то запоёт – И тайный этот огам А может, иероглиф, А может, код да Винчи Немедля был да сплыл. Его зохавал Ктулху, Зарыли тамплиеры, Спалила инквизиция И Сталин запретил. Отсюда: http://ycnokoutellb.livejournal.com/418672.html --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
|