Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
KoLenka Питерская я Сообщений: 2393 На сайте с 2021 г. Рейтинг: 12973 | Наверх ##
6 марта 2024 0:48 evva написал: [q] Поясните, пожалуйста, Генотек и Яндекс делают одну и ту же работу параллельно?[/q]
Яндекс, единственный, кто делает работу - официально договорившись с архивами и заключив договор, ну, а все остальные , вероятно .... сейчас много сайтов занимается распознаванием. Не только Генотек. | | Лайк (1) |
D_SK Участник
Москва Сообщений: 80 На сайте с 2009 г. Рейтинг: 75 | Наверх ##
6 марта 2024 3:06 7_kolen_predkov написал: [q] Daemon2011 написал: [q] Генотек использует движок Яндекса для распознавания снимков, сделанных мормонами.
[/q] Генотек форумчане юзали и делились опытом в марте 2022 года https://forum.vgd.ru/4536/1310...ew&o=, а ЯА появился в январе 2023.
[/q]
Вы удивитесь, но Daemon2011 ни слова не сказал в данном случае про сервис "Яндекс Архив", он говорил, как я понял, про использование самого Яндекса. И посмотрите на начало URL-адреса любого снимка, который якобы "находит" Генотек. Вопросы отпадут — сами собой! https: // text-recognition.storage. yandexcloud.net/ | | Лайк (2) |
D_SK Участник
Москва Сообщений: 80 На сайте с 2009 г. Рейтинг: 75 | Наверх ##
6 марта 2024 4:22 То есть, насколько я понимаю, компания "Генотек" — ничего сама не распознаёт и ничего сама не ищет! "Генотек" использует, для своей рекламы, чужие ресурсы, чужие разработки и чужие сканы (как уже заметили, работу тех же мормонов).
И, как говорится, вишенка на торте! На сайте "Генотека" пафосно указано, что "мы проиндексировали около двух миллионов сканов документов Главархива Москвы" (сразу вспоминается дореволюционная басня "Муха"). А в их фильтре Главархив Москвы — стоит на почётном первом месте. Но попробуйте посмотреть, например, "сканы" московского архива по ссылке непосредственно с сайта "Генотека" (если конечно что-то нужное найдется). И у вас ничего не получится! Там даже при переходе на сайт www.cgamos.ru — выдается исключительно ошибка "404".
P.S. Я сначала думал, что у "Генотека" просто поиск такой — кривой и косой — по документам Главархива Москвы. Но теперь у меня стойкое подозрение, что он там уже просто вообще ничего не "ищет"! Т.е. у "Генотека" остались одни мормоны. | | Лайк (2) |
idylle Санкт-Петербург Сообщений: 3196 На сайте с 2017 г. Рейтинг: 2241 | Наверх ##
6 марта 2024 9:37 D_SK написал: [q] Т.е. у "Генотека" остались одни мормоны.
[/q]
Вологодский архив у них не от мормонов, а из доступа самого ГАВО, | | |
D_SK Участник
Москва Сообщений: 80 На сайте с 2009 г. Рейтинг: 75 | Наверх ##
6 марта 2024 10:18 idylle написал: [q] D_SK написал:[q] Т.е. у "Генотека" остались одни мормоны. [/q] Вологодский архив у них не от мормонов, а из доступа самого ГАВО,[/q]
Если это действительно так, то... уговорили, почти одни мормоны! И этот факт — ничего совершенно не меняет. | | Лайк (1) |
Daemon2011 Сообщений: 725 На сайте с 2011 г. Рейтинг: 582 | Наверх ##
6 марта 2024 10:32 7_kolen_predkov написал: [q] Daemon2011 написал:
[q]
Генотек использует движок Яндекса для распознавания снимков, сделанных мормонами.
[/q]
Генотек форумчане юзали и делились опытом в марте 2022 года https://forum.vgd.ru/4536/1310...ew&o=, а ЯА появился в январе 2023.
[/q]
Яндекс OCR/Vision появился задолго до Генотек.Архив и Яндекс.Архивы - ещё в 2019 году | | Лайк (2) |
Daemon2011 Сообщений: 725 На сайте с 2011 г. Рейтинг: 582 | Наверх ##
6 марта 2024 10:36 6 марта 2024 10:46 D_SK написал: [q] То есть, насколько я понимаю, компания "Генотек" — ничего сама не распознаёт и ничего сама не ищет! "Генотек" использует, для своей рекламы, чужие ресурсы, чужие разработки и чужие сканы (как уже заметили, работу тех же мормонов).
[/q]
И да, и нет: Генотек использует ИИ Яндекса и снимки мормонов, но кое-что они вложили - деньги. За распознавание 1000 разворотов (как раз 1 пленка у мормонов) Яндекс берет 1500 рублей. Т.е. за распознавание сотен пленок Генотек выложил круглую сумму и это достойно уважения Ну и хранение гигабайтов снимков тоже стоит копеечку. Как и БД, и разработка сайта с системой поиска. В общем, не стоит недооценивать заслуги Генотека. | | Лайк (3) |
7_kolen_predkov ДиВанное заМКАДье Сообщений: 1083 На сайте с 2021 г. Рейтинг: 3510
| Наверх ##
6 марта 2024 10:53 D_SK написал: [q] использует, для своей рекламы, чужие ресурсы, чужие разработки и чужие сканы (как уже заметили, работу тех же мормонов) [/q]
Около 50 вариантов перевода "Гамлета" Шекспира на русский язык разными авторами - это использование чужих стихов и движка русского языка Конечно, работа поэта так, фигня. Важна машинистка, которая текст оригинала на английском перепечатала. | | Лайк (1) |
idylle Санкт-Петербург Сообщений: 3196 На сайте с 2017 г. Рейтинг: 2241 | Наверх ##
6 марта 2024 15:57 "В Петербургском центральном архиве занимаются разработкой программы, которая упростит поиск информации в объемных документах. Ее суть состоит в том, чтобы искать нужную информацию внутри документа. Программу планируют внедрить в систему ГИС (Государственные архивы Петербурга). Полностью проект планируют воплотить к 2026 году. Сейчас оцифровано и загружено в ГИС более 20 миллионов страниц архивных документов." ССЫЛКАВот поэтому (одна из возможных причин!)) Архивы Петербурга не идут на сделку с Яндексом. | | Лайк (6) |
apuzanoff Модератор раздела
Ставропольский край Сообщений: 2340 На сайте с 2017 г. Рейтинг: 1483 | Наверх ##
6 марта 2024 18:27 idylle написал: [q] В Петербургском центральном архиве занимаются разработкой программы, которая упростит поиск информации в объемных документах. Ее суть состоит в том, чтобы искать нужную информацию внутри документа. Программу планируют внедрить в систему ГИС (Государственные архивы Петербурга).
Полностью проект планируют воплотить к 2026 году. Сейчас оцифровано и загружено в ГИС более 20 миллионов страниц архивных документов."
Вот поэтому (одна из возможных причин!)) Архивы Петербурга не идут на сделку с Яндексом.
[/q]
Тот случай, когда архив начинает заниматься абсолютно непрофильными для себя вещами Видимо они и другие деятели, слабо понимающие, что они делают, наобещали Росархиву, что сделают в 100 раз лучше, чем у Яндекса, а те и рады "крайне не рекомендовать" сотрудничать с Яндексом | | Лайк (5) |
|