Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
platonshukin Сообщений: 117 На сайте с 2023 г. Рейтинг: 275 | Наверх ##
1 ноября 2023 19:41 jrw написал: [q]
Лучше бы алгоритмы распознования текстов и поиска исправляли, и сайт сделали более удобным для пользователей. И наберите уже штат корректоров и специалистов по расшифровке, как было обещано ранее. Чтобы очепяток не было.
Проект хороший и необходимый, но его исполнение "хромает" с самого запуска.[/q]
Спасибо за комментарий. Я посоветовался с командой и мы готовы предложить вам работу специалиста по расшифровке (если договоримся об условиях). Чтобы нам правильно спланировать работу, уточните, пожалуйста, сколько вам понадобится времени, чтобы исправить очепятки на 9.5 миллионах листов? | | Лайк (33) | Жалоба (1) |
Helen V Москва Сообщений: 6078 На сайте с 2016 г. Рейтинг: 2509
| Наверх ##
1 ноября 2023 22:12 1 ноября 2023 22:13 platonshukin написал: [q] Спасибо за комментарий. Я посоветовался с командой и мы готовы предложить вам работу специалиста по расшифровке (если договоримся об условиях).[/q]
Как быстро вы принимаете решения! В полшестого увидели, в полвосьмого уже посоветовались. А как насчет внесения таких правок: - разбить (или сделать выпадающее меню) в разделе Метрические книги (на родившихся, бракосочетавшихся, умерших и разведшихся)? Нет, скажете вы, это не всегда возможно, ведь в метрической книге вперемешку есть и такие, и сякие дела, и никакие алгоритмы неспособны... и так далее. А еще всегда приятно, ища рождение, случайно найти брак) - разбить фильтр ГОДЫ на Крайние годы дел /Годы записи Нет, скажете вы, это невозможно, да и ненужно, так как крайние даты дел... и так далее. - пробовали ли вы сами задавать название архива в правой части экрана? Правда, удобно? Нет, скажете вы, все удобно - ведь можно задать название части архива, а не угадывать аббревиатуру (например, для поиска ЦГА Москвы нужно набрать 4 буквы: МОСК, а для поиска Егорьевска и Балашихи - целых пять!) - пробовали ли вы сами задать название фонда по части слова? Правда, все очень удобно? А если часть слова не ищется в найденном фонде - как узнать, проиндексирована ли опись или просто такого слова в описи нет? Нет, скажете вы, еще далеко не все оцифровано и так далее. И уж совсем высший пилотаж - это уметь различать отчество и фамилию. Ведь в метрических книгах отчества в основном писались без "ич": Александр Сергеев Пушкин. И уж совсем высший пилотаж. Бывая в читальном зале ЦГА Москвы, постоянно вижу посетителей как раз вашего возраста (т.е. заведомо знакомых с яндексом, а не бабушек, вышедших на пенсию в докомпьютерную эру). Так они ничего не знают про этот сервис и продолжают пользоваться бумажными описями и тыкать в клавиатуру компов архива. Нет, скажете вы, мы не заинтересованы в специальной рекламе, в т.ч. в читальных залах архивов... Посоветуйтесь с командой. Я недорого беру за тестирование. Пойду агитировать за hryc.by --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | |
Helen V Москва Сообщений: 6078 На сайте с 2016 г. Рейтинг: 2509
| Наверх ##
1 ноября 2023 22:18 platonshukin написал: [q] Не совсем так, очень хотим общаться и надеемся на взаимность heart.gif
Уточню: на этапе запуска проекта мы говорили с представителями архивов Санкт-Петербурга, но, как правильно написано в документе, официального запроса в Архивный комитет не направляли. Попробуем исправить эту оплошность.[/q]
Браво! Хотели общаться и надеялись на взаимность, но официального запроса не отправляли. Видимо, надеялись на интуицию сотрудников Архивного комитета --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | Лайк (1) |
Daemon2011 Сообщений: 725 На сайте с 2011 г. Рейтинг: 582 | Наверх ##
1 ноября 2023 22:30 Стыдоба: единственная страна мира, чей локальный поисковик бесплатно * договорился с бюрократической машиной госархивов (потратил время) * загрузил к себе в хранилище гигабайты фоток (потратил место) * распознал их (потратил вычислительные ресурсы) * сделал клевый сайт (потратил человекочасы) а люди либо хают, либо ноют, либо требуют почти невозможного, либо доносят замечания в таком неконструктивном виде, что, наверно, руки у нашего мецената опускаются Вам бесплатно дают инструмент, который делает за вас 80% работы, а вы говорите "А ПОЧЕМУ НЕ ВСЕ 100%?" | | Лайк (35) | Жалоба (1) |
Daemon2011 Сообщений: 725 На сайте с 2011 г. Рейтинг: 582 | Наверх ##
1 ноября 2023 22:42 platonshukin, а будет ли развиваться язык запросов? Например, у языка запросов https://www.familysearch.org/ru/ есть простенькие инструменты: ? - на этом месте ровно 1 знак. Если написать Ива?ов, то в выдаче будет Иванов, Ивамов, Ивалов, Иваков, Ивасов и пр. Некоторые рукописные буквы похожи до степени смешения (особенно - н/м/к) и тут это сильно выручает. Для примера, Я.Архив дает результатов Иванов: 4684к Иваков: 10к Ивалов: 5к Ивамов: 1к Не все варианты написания очевидны, так что даже "методом каменной задницы" удается перебрать не все способы написания. * - на этом месте от 0 до 10 знаков. Если написать *горелов, то в выдаче будет Горелов, Погорелов, Пригорелов и пр. Если написать По*ников, то в выдаче будет Поников, Почников, Поченников, Посников, Постников и пр. Если написать Руса*, то в выдаче будет Русанов, Русаков, Русаковский, Русашвили и пр. " " - точное совпадение формы. Если написать "Белова", то в выдаче не будет ни Белов, ни Беловъ, ни Беловы. Несмотря на их простоту, выручают они знатно | | Лайк (2) |
Helen V Москва Сообщений: 6078 На сайте с 2016 г. Рейтинг: 2509
| Наверх ##
1 ноября 2023 22:43 Daemon2011 написал: [q] либо доносят замечания в таком неконструктивном виде, что, наверно, руки у нашего мецената опускаются dntknw.gif[/q]
Это вы про мои замечания? Ну так доработайте их. Уверена, что вы их тоже замечали. --- План на следующую неделю: пн - ЦИАМ/ГАРФ, вт РГАЭ/ЦИАМ, ср РГВИА/ГАРФ | | |
KoLenka Питерская я Сообщений: 2398 На сайте с 2021 г. Рейтинг: 12980 | Наверх ##
1 ноября 2023 22:53 platonshukin написал: [q] Чтобы нам правильно спланировать работу, уточните, пожалуйста, сколько вам понадобится времени, чтобы исправить очепятки на 9.5 миллионах листов?
[/q]
Здравствуйте Платон! Только, наверное, одна я, прочла в Ваших словах некий сарказм и иронию  . Ведь не зря ВЫ дописали эту фразу про 9,5 млн листов. И понятно, что листы будут только добавляться в дальнейшем. Если честно, то я бы правила только названия губерний, уездов, волостей и имена. Этого, я считаю, для начала, было бы вполне достаточно. Но я не программист, и как работают эти алгоритмы, не понимаю, поэтому и вмешиваться не буду. Но если ВЫ вдруг серьёзно готовы предложить работу по правке текстов, то хочу посоветовать Вам следующее. На форуме существует вот такой топ https://forum.vgd.ru/post/27/139613/p4747289.htm#pp4747289 , как раз по прочтению древних рукописей, метрических книг и прочих документов.. Павел, в этом топе, как раз один из экспертов. За активную работу имеет орден мЯдальку ВГД. и если, у Яндекса, действительно есть такая возможность, нанять некоторое количество людей для правки текстов, то очень хотела бы Вам порекомендовать наших экспертов именно из этого топа. Вот точно - не пожалеете. И Яндексу - их работа пойдёт только на пользу. Смотрите, один из старейших экспертов топа Тимур, он же timas https://forum.vgd.ru/index.php...mp;u=10705 ИМЕЕТ ПРОФИЛЬНОЕ образование и тоже, медальку ВГД. На счёт остальных не знаю, что касается образования, но расшифровывают они самые "замыленные и слепые" тексты, там, где надежда прочитать, исчезла ещё в прошлом веке. А они читают. Я бы ВАм могла с лёту назвать имена, как минимум 10-15 человек, к кому можно обратиться. но боюсь, что кого-то пропущу, или кто-то наоборот, ушёл с форума Но если Вы решитесь предложить ребятам работу, достаточно написать Тимуру и Павлу и они соберут команду. Ваш проект замечательный и очень необходимый, наверное, всем нам!! От себя лично, не могу не сказать спасибо Никогда не думала, что на Яндексе смогу кого-то найти. Завела в поиск :только уезд и фамилию Красновский, и нашла трёх родных братьев из одной деревни и еще одного из второй. С семьями и детьми. Обрадовалась, но куда и кому, а они были Ивановичи, ясен пень, этих братьев пристроить - не знала. И вдруг, совершенно случайно, 70 летний мужчина, нашедший меня в соцсетях, присылает мне поколенную роспись составленную его дедушкой. Очень чёткую, со всеми датами рождения и смерти. И в этой росписи, у одного из Иванов, я вижу запись, сыновья Иван, Пётр и Елисей уехали в Москву. Бинго !! Так у меня совершенно случайно сложился полный пазл. Успехов Вам и дальнейшего развития проекта | | Лайк (12) |
KoLenka Питерская я Сообщений: 2398 На сайте с 2021 г. Рейтинг: 12980 | Наверх ##
1 ноября 2023 22:57  ого, сколько тут всего произошло, пока я сочиняла свой опус | | Лайк (2) |
KoLenka Питерская я Сообщений: 2398 На сайте с 2021 г. Рейтинг: 12980 | Наверх ##
1 ноября 2023 23:01 jrw написал: [q] KoLenka Елена, он просто поиздевался, не обращайте внимание.[/q]
Павел, а вдруг Платон был серьёзен ?? Не горячитесь. Давайте дождёмся его ответа. Очень интересно. Одно то, что ЯНдекс, в лице Платона вышел с нами на связь, вселяет некую надежду, что с нашей общей помощью проект будет только лучше и удобнее. | | Лайк (4) |
Михаха Сообщений: 4143 На сайте с 2008 г. Рейтинг: 3859 | Наверх ##
1 ноября 2023 23:28 jrw написал: [q] Искренне благодарю данных пользователей за поддержку нахамившего и поиздевавшегося господина.[/q]
Может всё не так плохо? И эти лайки не в защиту хама, а поддержка хорошего проекта? Но ситуация, как в анекдоте: "Алло! Это прачечная?..." | | Лайк (4) |
|