Яндекс - «Поиск по архивам»
| Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 101 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
| jrw Сообщений: 5641 На сайте с 2021 г. Рейтинг: 6163
| Наверх ##
12 февраля 2023 21:22 12 февраля 2023 21:29 LeTom написал: [q] Там же написано, что работают эксперты[/q]
Извините меня, но Вы не правы. Вы читали, что он пишет на хабре ? У них никаких экспертов, это им не выгодно. Они хотят в будущем разрешить пользователям исправлять ошибки прочтения. | | |
LeTom Москва Сообщений: 1299 На сайте с 2012 г. Рейтинг: 9490 | Наверх ##
12 февраля 2023 21:30 jrw Мда... После "команды подпевал" мне больше нечего Вам сказать. Я читала. Вы увидели, что хотели увидеть. --- Ищу потомков: Фролова Василия Петровича, Карпухина/Карпина Осипа (Иосифа) Степановича, Панферовых/Парфеновых Московская губ., Подольский уезд.
**************************
Исполняю заказы по расшифровке рукописных текстов 18-19 вв.
| | |
LeTom Москва Сообщений: 1299 На сайте с 2012 г. Рейтинг: 9490 | Наверх ##
12 февраля 2023 21:44 jrw Вы опять удаляете свои сообщения. Я хотела Вам ответить в личке, но Вы меня поставили в игнор. Ну ладно. --- Ищу потомков: Фролова Василия Петровича, Карпухина/Карпина Осипа (Иосифа) Степановича, Панферовых/Парфеновых Московская губ., Подольский уезд.
**************************
Исполняю заказы по расшифровке рукописных текстов 18-19 вв.
| | |
Ekaterinburg Екатеринбург Сообщений: 2963 На сайте с 2018 г. Рейтинг: 4047 | Наверх ##
12 февраля 2023 21:58 jrw написал: [q] LeTom А Вы знаете кто обучал нейросеть ? Я написал, что ни одна нейросеть никогда не сможет правильно расшифровывать старинные тексты. И за это руководитель проекта "Яндекс Архив" меня исподтишка заминусовал. Вы считаете, что правильно обманывать пользователей говоря на главной странице их сайта про команду экспертов ? Почему он не воспринимает здравую критику и не общается с пользователями на форуме, который постоянно посещает и минусует, тех кто критикует его проект ? Заметьте я его лично не оскоблял и не унижал. Как он унизил меня...[/q]
Мне жаль, что вы получили такую негативную обратную реакцию. Вы хороший специалист по чтению текстов. Но очень часто люди которые считают себя правыми ненавидят тех, кто смеет им возражать. Я тут уже столько в свой адрес гадостей прочитала и ещё честь это обсуждение в личке. Всегда считала, что человек который не поступает лучше меня, делает лучше, а говорит и пишет гадости, унижает - это он от бессилия, от того, что он не состоялся. Так что идите вперёд и не обращайте внимания. Каждый человек имеет право на свое мнение, даже если оно отличается от мнения большинства. Считайте себя джордано Бруно или коперником в генеалогии 😉 --- Поиск в архивах г. Екатеринбурга и Свердловской области.
Консультации, работа с ЗАГСами
Дневник Ekaterinburg | | Лайк (2) |
LeTom Москва Сообщений: 1299 На сайте с 2012 г. Рейтинг: 9490 | Наверх ##
12 февраля 2023 22:08 jrw написал: [q] Мой второй гемморрагический инсульт будет на совести господина программиста Яндекса abolkhovityanov и его друзей xbox и А2 [/q]
Боже! Всё-таки они виноваты... Блин, я в шоке! Крепкого здоровья Вам! --- Ищу потомков: Фролова Василия Петровича, Карпухина/Карпина Осипа (Иосифа) Степановича, Панферовых/Парфеновых Московская губ., Подольский уезд.
**************************
Исполняю заказы по расшифровке рукописных текстов 18-19 вв.
| | |
KoLenka Питерская я Сообщений: 2358 На сайте с 2021 г. Рейтинг: 13280 | Наверх ##
12 февраля 2023 23:39 Друзья мои. Вы зря поругались на самом деле. Павел совсем не отрицал Яндекс поиск. Зря Павел, Вы потерли свои сообщения.jrw написал: [q] Нашел первую запись из моего дерева. Уезды и волости расшифрованы правильно, названия деревень исковерканы до неузнаваемости.[/q]
jrw написал: [q] А так довольно интересно искать своих родственников, [/q]
И задела его не программа, а враки про экспертов, которых, как таковых нет. Задели фото экспертов, с американских стоковых сайтов. Сейчас, элементарно можно все проверить. jrw написал: [q] Стоковые фото американцев. Яндекс как всегда на "высоте" ![/q]
Александр находится на нашем сайте ВГД, уже не первый год. А аж с 2015 года Знает "кухню" сайта. Павел jrw, смотрит, на новый проект, как раз, как эксперт, ибо он , так же, как и Елена Le Tom, понимает и хорошо разбирается в рукописях. Не зря у человека за 2 года, такое количество благодарностей, именно за прочтение текстов. Я бы на месте Александра https://forum.vgd.ru/index.php...p;u=161716 не ругалась, и не пренебрегала форумом, а обратилась как раз к помощи тех самых экспертов. Вот Тимур - он имеет ПРОФИЛЬНОЕ образование https://forum.vgd.ru/?m=feed&a=list_warn4&u=10705Кто лучше Тимура разбирается в древних рукописях?? Именно Тимур читает тексты, какие бы длинные, старые, нечитаемые они не были. Именно он, я думаю, может дать миллион советов разработчикам Яндекса, коль на то пошло. Миллион советов, Вам , Александр, может дать и Павел и Елена. Не пренебрегайте ими, пожалуйста. Никто не кричит, что проект плохой. Это Вы зря. Вся проблема в том, что везде упоминаются эксперты, которых нет. Что касается меня, то я уже писала. Для меня проект стал настоящим открытием, ибо я не знала, что одна ветвь у меня сбежала в Москву. Я бы никогда и искать не полезла, просто кто-то написал, введи фамилию и уезд. Я так и сделала. И ещё, очень бы хотелось Александр, чтобы Вы вышли на форум и участвовали в диалогах этой ветки. Никто никого оскорблять не собирается. А вот услышать Ваши ответы, о перспективах проекта, было бы очень интересно. Мне вот, интересно услышать Ваши советы по настройке фильтров для поиска . https://forum.vgd.ru/post/169/140482/p4433698.htm#pp4433698Спасибо | | Лайк (9) |
KoLenka Питерская я Сообщений: 2358 На сайте с 2021 г. Рейтинг: 13280 | Наверх ##
12 февраля 2023 23:45 jrw написал: [q] Я написал, что ни одна нейросеть никогда не сможет правильно расшифровывать старинные тексты.[/q]
Павел, да ну, пусть сеть и не расшифровывает. Мне было бы достаточно, если бы сеть правильно прочитала губернию, уезд и волость. При невозможности ввести фамилию, как в моем случае, или в случае Ивановых, Петровых, Сидоровых, уже одно это, очень бы помогло поиску. Ну, а документы, мы с Вашей помощью и сами прочтем. | | Лайк (2) |
microArt г.Гатчина, Ленинградская область Сообщений: 3297 На сайте с 2008 г. Рейтинг: 2502 | Наверх ##
13 февраля 2023 1:03 balt-amber написал: [q] И когда наконец наступит светлое будущее машины будут не только расшифровывать содержание метрических книг, но и произносить то, что прочитали приятным голосом.[/q]
Создавать виртуальные деревни на месте исчезнувших. Создавать дополненную реальность на месте утраченных домов и храмов. Погружение в историю. Прибываешь на место, надеваешь шлем виртуальной реальности - и как будто в машине времени - вперед, в прошлое. А кибернетический гид все тебе расскажет о каждом, кто здесь жил... Если только у людей интерес к истории к тому времени не пропадет - из-за событий в настоящем. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
| Nadin2012 Москва Сообщений: 298 На сайте с 2012 г. Рейтинг: 230
| Наверх ##
13 февраля 2023 6:40 У Яндекса в выдаче все-таки избыточная точность. Одна буква в фамилии изменена, и уже не находится. Приходится вертеть все возможные виды ошибок. Это конечно лучше, чем у Генотека, который на фамилию Зыкин выдает кучу записей со словом законная, но все же хотелось бы какой-то компромиссный вариант. | | Лайк (2) |
| Kreutzer Сообщений: 337 На сайте с 2023 г. Рейтинг: 137
| Наверх ##
13 февраля 2023 10:43 Довольно странно критиковать проект. Понятно, что алгоритмы будут дорабатываться, какие-то планово, какие-то на ходу, по ситуации. Нейросеть, она же ИИ, будет "обучаться", уверен, будет читать и трудночитаемые тексты. Наберёт необходимую массу "образцов" и начнёт выдавать (здесь скорее печальна медлительность архивов по оцифровке и какая-то патологическая госжадность в большинстве регионов, заперших сканы под оплату), надо дать время, хотя понятно, что всем нам хочется быстрее. Конечно, она научится более точно работать по регионам и церквям, когда "поймёт", что их список ограничен и известен.
Работа невероятно интересная, причем уверен, что программистам интересна и с профессиональной точки зрения (много разных вариантов можно покрутить).
Поэтому, проект обречен на успех и востребованность. Жду новых книг от архивов, жду оцифровки ЗАГС (не очень понятно, почему закрыта большая оцифрованная база ЗАГС, которую видит любое МФЦ, открыть только ФИО вполне можно было бы, даже без дат рождения и смерти, если уж это перс инфо), книг регистрацти захоронений и остальных книг.
Если сравнивать с FamilySearch, их ИИ распознает тоже по-разному, что интересно, если он сомневается то выдаёт несколько вариантов записи, которые как ему кажется, могут быть похожими на написанное | | |
|