Яндекс - «Поиск по архивам»
Imbir Новичок
Сообщений: 16 На сайте с 2021 г. Рейтинг: 99 | Наверх ##
25 января 2023 11:29 Возможно, кто-то не знает, темы такой не нашла. Яндекс запустил поиск по распознанным через ИИ архивам. Протестировала, пока, увы, видимо, в основном московские метрики и архивы, но и это - большое подспорье. Достаточно просто ввести в строку поиска фамилию, например, и выведется скан из архива, который доступен. Надеюсь, будет полезно: https://yandex.ru/archive Обратная связь с разработчиками.Пара советов, как задавать им вопросы. https://forum.vgd.ru/post/169/140482/p4446064.htm#pp4446064https://forum.vgd.ru/post/169/140482/p4447315.htm#pp4447315Яндекс "Поиск по архивам" в ТГ.Как Яндекс научился распознавать, что написано в рукописных архивах: статья на Хабре о технологиях распознавания рукописного текста и в комментариях - ответы на некоторые вопросы. Инструкция как открыть все дело, а не только одну найденную страницу от ozerskayaВ помощь желающим скачать изображение на локальный компьютер расширения для браузера от okolobaxa
Новости проекта 09.06.2023 Яндекс.Архивы добавили на сервис материалы ГАИО, загрузка и распознавание еще продолжаются, в общей сложности будет более 700 тыс. сканов по всем описям ф. 50 (включая особо ценные). 28.07.2023 Добавили Архивное управление Администрации городского округа Балашиха Московской области - Фондов 1 Дел 116 Оцифровано дел 114 Документов 55 323 31.10.2023 Первые итоги осени - Мы добавили на сервис “Епархиальные ведомости” и другие издания Русской Православной Церкви — около 77 тысяч выпусков или 3,5 млн сканов.
- Также наш сервис пополнился материалами Государственного архива Астраханской области — в общей сложности около 1,5 млн сканов.
- В разделе ЦГА Москвы добавилось более 600 дел, отсканированных архивом с июня по сентябрь.
- В общей сложности на 376 дел пополнилась коллекция материалов ОГАОО (Оренбургская область).
- 150 новых дел прислали наши партнеры из Государственного архива Иркутской области.
09.11.2023 ОГАОО прислал еще более 400 отсканированных дел с метрическими книгами! 14.11.2023 У нас появилось около 6 тысяч новых дел фонда 229 «Московская духовная академия». 21.11.2023 У нас снова пополнение! Теперь пользователям «Поиска по архивам» доступны материалы из Муниципального архива Уссурийска — около 140 дел с метрическими книгами из церквей города и близлежащих сёл. 24.11.2023 Добавили 50 новых дел архива Иркутской области (ГАИО), Ф. 50 Иркутская духовная консистория источник29.11.2023 Выложили материалы Ф. 392 оп. 1 Оренбургского архива "Книги записи родившихся, бракосочетавшихся, разведшихся и умерших евреев по городу Оренбургу" (75 дел) 06.12.2023 К юбилею "Вечерней Москвы" выложили на сервис полный архив газеты за 100 лет (разумеется, распознанный и с возможностью поиска) источник11.12.2023 Оренбургский архив продолжает радовать - с начала декабря прислали сканы более 400 новых дел. источник15.12.2023 Главархив Москвы передал в "Поиск по архивам" почти 1000 дел, отсканированных еще в октябре. Все уже выложены на сервис и почти все уже распознаны. источник21.12.2023 Выложили МК и записи ЗАГС муниципальных архивов Каширы, Луховиц и Павловского Посада, всего около 200 тыс. сканов источник27.12.2023 Выложили обновление по Оренбургу, документы распознались и появились в результатах поиска. Всего 246 дел. + перезалиты в лучшем качестве Ф. 98 оп. 2 д. 2 источник12.01.2024 Первые обновления января ( источник) 06.02.2024 За прошедшую неделю «Поиск по архивам» пополнили почти 360 новых дел! Это свыше 100 тысяч сканов, поступивших из четырёх регионов страны. ( источник) 25.02.2024 390 дел, отсканированных Главархивом Москвы в январе, загружены на сервис, распознаны, доступны в поиске (еще одно доедет на ближайшей неделе). ( источник) 27.02.2024 Добавлено более 500 дел с метрическими книгами и записями ЗАГС с 1893-го по 1925 год из Государственного архива Приморского края ( источник) 10.03.2024 Коллекцию «Поиска по архивам» пополнили материалы из фондов Государственного архива Вологодской области. На сервисе уже размещено около 800 дел (84,5 тыс. листов) ревизских сказок и других документов Вологодской казенной палаты; подготовка и публикация материалов продолжаются. ( источник) 16.04.2024 Коллекцию «Поиска по архивам» пополнили 92 метрические книги, относящиеся к Камышловскому и Екатеринбургскому уездам Пермской губернии — сейчас это территория Курганской и Свердловской областей, хранившиеся в библиотеке Екатеринбургской духовной семинарии. ( источник) | | Лайк (106) |
jrw Сообщений: 5687 На сайте с 2021 г. Рейтинг: 6145
| Наверх ##
5 февраля 2023 17:12 5 февраля 2023 18:43 microArt написал: [q] Сейчас накаркаете. Не хочу, чтобы по настоящему интересные ресурсы стали бы платными. Искренне, не хочу.
[/q]
 | | Лайк (2) |
balt-amber Сообщений: 850 На сайте с 2011 г. Рейтинг: 453
| Наверх ##
5 февраля 2023 17:39 А мне отвечали, целых два раза. --- Ольшанка, Никольское Кашаево тож (Кашаевка), Никольское Шичкилей тож Пензенского наместничества (XVIII век и ранее).
Христорождественское Васильево село Стерлитамакского уезда (Васильевка Мелеузовского района)
Фролово, Мологинской волости, Старицкого уезда | | Лайк (2) |
xbox Сообщений: 996 На сайте с 2020 г. Рейтинг: 1976
| Наверх ##
6 февраля 2023 1:42 ИнокКент написал: [q] Но есть одна особенность, которая реально бесит. Яндекс постоянно добивается, чтобы пользователь включил куки. Так хочется залезть в душу!.. Я их всегда запрещаю. ПРИНЦИПИАЛЬНО. И мои сисадмины категорически не советуют... ... Нет, вы представьте! Просмотрел 10 записей и нажал следующую страничку. Это так нетипично для живого человека - ну, вылитый автомат![/q]
Куки - это одна из ключевых технологий, без которой большинство сайтов сложнее визитной карточки работать будет некорректно. В том числе не будет корректно работать почта, интернет-магазины, форумы итп. И форум VGD в том числе. Принципиальное запрещение кук - это принципиально неправильно. Это перестраховка из серии шапочки из фольги против излучения сотовых вышек, перечеркивания штрих-кодов на упаковках товаров итп. Отключив куки на постоянной основе, Вы получаете "поломанный" серфинг, но почти не получаете дополнительной приватности. Да, может быть в результате Ваших действий Яндекс при показе рекламы ошибется и предложит вместо надувного бассейна для дачи книжку про голодание. Но в любом случае Ваши "портрет" и с отключенными куками автоматически будет составлен. Для этого есть много других технических возможностей. Например, пока Вы читаете это сообщение с отключенными куками, Яндекс Метрика каждые несколько секунд записывает и передает данные о Вас. И вся информация о Вашем IP-адресе, браузере, операционной системе о переходах по страницам итп у Яндекса есть. Можно и с Яндекс.метрикой бороться, но все равно найдутся способы Вас идентифицировать. Можете почитать про уникальный цифровой отпечаток браузера и тп... Кроме того сложно рассчитывать на полную приватность, если в профиле на форуме стоит фотография, указан город, перечислены несколько десятков фамилий в роду и оставлено более 2тыс сообщений, в которых, наверняка есть личная информация и про Вас и про родственников. Если кому-то действительно понадобиться Вас найти, Вас найдут. А если, вдруг правоохранительным органам очень-очень понадобиться Вас найти, то звонок в дверь прозвучит быстрее, чем успеете допить чашку чая. Я сейчас посмотрел статистику по нескольким сайтам. Куки включены у 99,7% пользователей. Не удивительно, что при их отключении Яндекс подозревает роботов. Это действительно один из отличительных признаков некоторых роботов. И даже после того, как Яндекс убедится, что Вы не робот, он должен где-то это записать. А запись эта делается в тех самых куках. Резюме - Если удалить у велосипеда педали, не нужно удивляться, что не получается разогнаться, и тем более не стоит советовать это повторять остальным.
 --- epoisk.ru – Продвинутый онлайн поиск метрических книг, исповедных ведомостей, и ревизских сказок в ЦГА Москвы. | | Лайк (20) |
Offnames Санкт-Петербург Сообщений: 395 На сайте с 2018 г. Рейтинг: 260 | Наверх ##
6 февраля 2023 10:09 А вот бы прикрутить эту ИИ-технологию в виде плагина чтоб распознавать на любых сайтах  . Ну например питерских архивов? | | Лайк (1) |
gbyudby Москва Сообщений: 1665 На сайте с 2020 г. Рейтинг: 896 | Наверх ##
6 февраля 2023 18:56 очень однако точный и чувствительный поиск у яндекса))
в частности - фамилии, содержащие внутри "Ь" убрал "Ь" в поиске - совершенно новые результаты )) | | Лайк (2) |
von_nachtigallPh.D. (Chem.)  Москва => не Москва Сообщений: 1917 На сайте с 2010 г. Рейтинг: 1957 | Наверх ##
6 февраля 2023 20:50 gbyudby написал: [q] очень однако точный и чувствительный поиск у яндекса))
в частности - фамилии, содержащие внутри "Ь" убрал "Ь" в поиске - совершенно новые результаты ))[/q]
Да и Федоров - Федоровъ - Феодоров - Феодоровъ - тоже не всегда одинаковые результаты даёт --- Ik bun Normalis Archivaris
En ik beitel kronieken in een rots...
Ich fahre hier,
Ich fahre her
Ich habe keine Heimat mehr
R-M198, U7a (FTDNA); R-Z92, U7 (23&Me) | | Лайк (2) |
ИнокКент Москва, Российская Федерация Сообщений: 2527 На сайте с 2012 г. Рейтинг: 9577 | Наверх ##
6 февраля 2023 23:11 7 февраля 2023 14:11 xboxБольшое спасибо за ликбез. Я учился чему-то подобному 40 лет назад и, естественно, отстал. Но я на эту ситуацию смотрю, в числе прочего, и с профессиональной точки зрения. А я всё-таки юрист. И хочется верить, не из худших. Во-первых, собирать информацию очень часто незаконно. Да, Конституция позволяет "искать, передавать, хранить, распространять" её "любым законным способом. Но именно для персональной информации закон делает исключение, "переворачивает презумпцию". Во-вторых, в Вашей позиции есть некое внутреннее противоречие. Оно-то меня и бесит. xbox написал: [q] В любом случае Ваши "портрет" и с отключенными куками автоматически будет составлен. Для этого есть много других технических возможностей... Все равно найдутся способы Вас идентифицировать.[/q]
Разумеется. Составляйте "портрет" и идентифицируйте на здоровье. Но зачем непременно делать это именно тем способом, который страшно мешает мне работать? Потому что "так удобнее"? Вот именно это я и называю хамством. В-третьих, xbox написал: [q] и тем более не стоит советовать это повторять остальным[/q]
Это где же я такое советовал? Не передёргивайте, пожалуйста. --- Ищу купцов и мещан (Аккерман, Лида, Николаев); мазылов (Бендеры, Ананьев), канцеляристов (Екатеринослав, Нежин); СЦС (Казан., Симб., Твер., Яросл. губ.); казённых (Вятка), экономических (Меленки), владельческих (Курск, Муром) крестьян и дворовых (Дорогобуж, Тула, Кузьминское Подольск. уезда) | | Лайк (2) |
Kapibara2022Участник  Сообщений: 59 На сайте с 2022 г. Рейтинг: 123 | Наверх ##
7 февраля 2023 14:50 microArt написал: [q] Вот сейчас chatGPT - не хочу, чтобы он стал платным. [/q]
А что вам даёт эта штука,вот даже интиресно? Сейчас это всё так модно-популярно а я понять не могу,что дают эти фигли-мигли среднестатистическому человеку? Ладно,здесь я понимаю в чём польза, соответствующая тематике сайта. Хотя я уверена что еслибы её реализовали не через автоматику а через живых людей то было бы в разы эффективнее. есть же яндекс-толока, где за три копейки люди чтото делают,и вроде оно работает. Ну и тут могли бы платить немножко денег или на добровольных началах,зато результаты были бы не "Вто Рая" как тут ктото написал,а на человеческом языке. А вот остальные эти все супер-пупер-кибер технологии -зачем,а главное нафига? ))) | | Лайк (1) |
Kapibara2022Участник  Сообщений: 59 На сайте с 2022 г. Рейтинг: 123 | Наверх ##
7 февраля 2023 14:56 microArt написал: [q] Что в куках плохого? Они мне не мешают. (В отличие от рекламы Яндекса, от которой мне трудно иногда избавиться).[/q]
Мне удавалось избавится напрочь от рекламы Яндекса но у меня стало некорректно работать Авито после этого и я решила,ладно,пусть живёт пока. А от всех остальных реклам я избавилась целиком и полностью. Ни рекламных баннеров на сайтах,ни рекламы на ютубе я не вижу уже много лет. Моя комбинация : поисковик у меня стоит DuckDuckGo есть такой хотя про него мало кто слышал. Не Гугл и не Яндек,категорически нет. Только вот этот. Так же стоит Ublock это типа AdBlock блокировщик рекламы. Также стоит блокировщик ютубовской рекламы (т.е. мне не приходится ждать окончания рекламных роликов чтобы просмотреть видео на ютубе) И также стоит Hide Yandex Zen тоесть блокировщик ненавистного мне яндекс-дзена. Он не откроется даже если я нажму на статью из него случайно (например в поисковой выдаче. Вобщем считаю что в виртуальном пространстве я в бронежилете )))) Ну и куки чищу иногда,да. Хотя когда просят принять -морщусь но всегда принимаю. Рекламу то они мне всё равно показать не смогут! *зловещий смех* | | Лайк (3) |
microArt г.Гатчина, Ленинградская область Сообщений: 3298 На сайте с 2008 г. Рейтинг: 2493 | Наверх ##
7 февраля 2023 15:33 Kapibara2022 написал: [q] А вот остальные эти все супер-пупер-кибер технологии -зачем,а главное нафига? )))
[/q]
Я фантастику люблю. Интересно, во что все это в итоге разовьется. Люди, разговаривающие с машиной. И даже свои задачи кое-какие решают. Я бы вот вообще прогноз сделала бы. что к концу года уйма "умных колонок" будет со встроенным chatGPT. Мне кажется, что они были бы популярны. Хотя, после скандала с яндекс-колонкой (когда якобы микрофон включался произвольно для прослушки) - может быть, и нет. --- Псковские документы (метрические книги из фонда 39) здесь:
https://www.geno-dbase.ru/storage/Russian_Empire/Pskov/ | | |
|