Familysearch.org - архивная база мормонов
общие вопросы
gecube I-Z58 >I-Z138 > ... > I-A6397
Сообщений: 376 На сайте с 2015 г. Рейтинг: 194 | Наверх ##
15 марта 2017 11:01 klkjh написал: [q] не то что неудобно, с ним нужно научиться работать но когда на улице туман файлы висли даже в цси, так что скорость - многое упирается в нее - легче скачать, чем ждать загрузки[/q]
Он неудобен. Тем более, если у клиента монитор не высокого разрешения, а что-то типа 1400*900. klkjh написал: [q] попробуйте изучить курс палеографии для вузов думаю, учебник можно найти в сети транскрипция скорописи - вузовская дисциплина, требует знаний и опыта. никто не умел, пока не научился[/q]
Согласен, что расшифровка записей - практический навык. Достаточно просмотреть несколько страниц и глаз начинает разбирать почерк писаря. На это пока ни одна программа, ни одна нейронная сеть не способна. Поэтому, получается, индексирование - ручной труд. Неблагодарный, но нужный. И как очень верно раньше заметили - очень хорошо, когда можно записи сравнивать за разные года. Неоднократно сталкивался, что записи можно прочитать по-разному из-за особенностей почерка. Да и писарь мог ошибиться им с умыслом написать немного не так как раньше или позже. И выявить это можно только при наличии данных в комплексе. Увы, мормонов так не делают. Поэтому один и тот же человек может быть записан в индексе по-разному. Очень помогло бы делу, если существовала система, которая при наборе фамилии, имени, места и пр. данных подсказывала какие похожие данные уже есть в базе. И с хорошей вероятностью (при достаточном объеме индексированнх данных) вводимая строчка будет в базе. Но построение такой программы (не важно - веб или локальной) задача трудоемкая и чисто на энтузиазме ее не вытянуть. --- если нужен - пишите в почту gb12335 на гмыле или телеграм @gecube | | |
gecube I-Z58 >I-Z138 > ... > I-A6397
Сообщений: 376 На сайте с 2015 г. Рейтинг: 194 | Наверх ##
15 марта 2017 11:18 15 марта 2017 11:19 [q] Вероятно, программу можно научить распознавать и тексты 18-19 веков с введением образцов букв, с последующим вычитыванием полученного текста в ручную[/q]
Вряд ли. Обучение - это ручная работа. Сколько "файнридеру" придется скормить индексированных файлов, чтобы он научился воспринимать надежно один вид почерка? А тут как раз поменял счет писарь и придется по новой обучать. Прошу студента посадить за это занятие (дешевле и надёжнее будет) Хочу еще добавить, что машинный текст (распечатанный регулярным шрифтом - будь то в типографии или на печатной машинке) не распознают надежно. А мы про рукопись говорим. Возможно технологии в будущем и эту задачу решат. --- если нужен - пишите в почту gb12335 на гмыле или телеграм @gecube | | |
dickest Россия, Пенза Сообщений: 168 На сайте с 2010 г. Рейтинг: 434
| Наверх ##
15 марта 2017 11:42 severinn написал: [q] Наиболее известной и популярной является программа для распознавания рукописного текста под названием Fine Reader. Для того чтобы пользователь смог её применить, ему понадобится сканер. К слову сказать, этот прибор пригодится в любом случае, какую бы утилиту вы не выбрали. Ведь для того чтобы программа могла начать работу, ей нужна какая-то исходная информация о тексте. Наиболее простым способом является создание скана. Хотя некоторые программы способны осуществлять распознавание рукописного текста и при наличии обычной цифровой фотографии любого формата, предварительно загруженной в компьютер. Помните, чем лучше будет качество (разрешение) снимка, тем более качественно утилита выполнит свою работу. Fine Reader вполне можно найти в интернете и скачать без каких-либо финансовых вложений. Работать с этой программой довольно просто, так как она имеет простой и удобный интерфейс. Однако конечный результат может иметь существенные погрешности. Это будет зависеть от качества скана, а также почерка исходника." http://fb.ru/article/45852/ras...om-pomogut[/q]
Это реклама! Рукописный тест offline пока никакая программа распознавать не умеет!!! http://kb.abbyy.ru/article/783http://kb.abbyy.ru/article/1099https://habrahabr.ru/post/151856/http://idr.in.ua/info/rukopisniy-tekst.html (обратите внимание: буквы написаны раздельно) Но есть подвижки на уровне поделок студентов/аспирантов: https://geektimes.ru/post/136165/ | | |
Gontarсемейный историк  Saint Petersburg Сообщений: 2040 На сайте с 2003 г. Рейтинг: 2872 | Наверх ##
15 марта 2017 11:57 balt-amber написал: [q] Здравствуйте, пожалуйста, где же тут правильно найдешь с таким подходом?[/q]
Вы бы изучили подход, может и найдете --- Val
Нам трудно, а когда было легко? | | |
gecube I-Z58 >I-Z138 > ... > I-A6397
Сообщений: 376 На сайте с 2015 г. Рейтинг: 194 | Наверх ##
15 марта 2017 11:57 15 марта 2017 11:58 Краткое резюме: - рукописный текст мы пока можем распознать только вручную (и то - будут ошибки); - системы, которая это будет делать устойчиво, на текущем этапе развитии технологий скорее всего нет; - а если даже и есть или заказать ее разработку, то будет она стоить как Боинг. И еще к тому же не один. Что нереально не только для нас, но и для гигантов вроде мормонов. Ну, и время. Времени на разработку такого проекта уйдет масса. - поэтому хоть индексация и есть важная задача, но откладывать как фоновый процесс. - и все равно нужна платформа, которая позволит её проводить.
Вариант держать всё на персональных страничках мне не нравится, т.к. - информация получается фрагментированная; - очень легко теряется - сайт закрыли, человек перестал интересоваться темой или вообще с ним что-то случилось и т.п.
Нужна "единая точка входа". Пока единственным вариантом является настоящий форум. --- если нужен - пишите в почту gb12335 на гмыле или телеграм @gecube | | |
Gontarсемейный историк  Saint Petersburg Сообщений: 2040 На сайте с 2003 г. Рейтинг: 2872 | Наверх ##
15 марта 2017 11:58 klkjh написал: [q] были но в рс и мк их часто не писали, особенно у крепостных.[/q]
Вы же изучаете МК и ИР --- Val
Нам трудно, а когда было легко? | | |
gecube I-Z58 >I-Z138 > ... > I-A6397
Сообщений: 376 На сайте с 2015 г. Рейтинг: 194 | Наверх ##
15 марта 2017 12:01 dickest написал: [q] Но есть подвижки на уровне поделок студентов/аспирантов: https://geektimes.ru/post/136165[/q]
Да, большое спасибо за ссылку. Я что-то подобное и хотел здесь написать. --- если нужен - пишите в почту gb12335 на гмыле или телеграм @gecube | | |
Gontarсемейный историк  Saint Petersburg Сообщений: 2040 На сайте с 2003 г. Рейтинг: 2872 | Наверх ##
15 марта 2017 12:02 Jasminka написал: [q] Почему этот проект раньше не запустили?[/q]
Он давно запущен, сначала был как тестовый, сейчас будет для всех --- Val
Нам трудно, а когда было легко? | | |
Gontarсемейный историк  Saint Petersburg Сообщений: 2040 На сайте с 2003 г. Рейтинг: 2872 | Наверх ##
15 марта 2017 12:07 severinn написал: [q] не решение, те же вопросы, таких сайтов как ВГД можно найти немало, толку от них мало ONLINE
[/q]
ну да, нужно все и сразу и чтобы кто-то это сделал --- Val
Нам трудно, а когда было легко? | | |
Gontarсемейный историк  Saint Petersburg Сообщений: 2040 На сайте с 2003 г. Рейтинг: 2872 | Наверх ##
15 марта 2017 12:35 severinn написал: [q] тогда примите как данное, что каждый делает сам по себе и для себя[/q]
Да я вообще не предлагаю ничего кроме familysearch --- Val
Нам трудно, а когда было легко? | | |
|