ПОИСК ПО ИНДЕКСИРОВАННЫМ ДОКУМЕНТАМ. ОПЫТ ТЕСТИРОВАНИЯ
поиск по новой базе Генотек
CathycatМодератор раздела Семейный архивариус  Москва Сообщений: 301 На сайте с 2009 г. Рейтинг: 206 | Наверх ##
1 сентября 2022 19:09 7_kolen_predkov написал: [q]
Поиск в кавычках работает, если фраза не разорвана переносом на другую строку. А в метрических книгах очень часто фамилия, имя, отчество могут быть расположены в одной графе аж в три строки.
Много "шума". Мне по фамилии Патраков выдает кроме Патрикеев еще и Матрён. Это не считая деревни и починка с тем же названием. Итого 10 000+ вариантов
[/q]
Увы, с добавлением поиска с кавычками, даже обычный поиск стал хуже, как-то перестроили алгоритмы. Спрашивала у Генотека, говорят "все для вашего удобства" и т.д. Раньше, условно, пишешь (без кавычек) Анна, выдает +10 000 результатов. Добавляешь дочь/жена/вдова, выдача уменьшается до 5 000. Добавляешь отчество/сословие/местность, добавляешь фильтр по году нужному - и вот в выдаче уже 100-200-300 максимум записей. Просмотреть их было вполне реально. А сейчас, если написать " Анна Дмитриева вдова Тульской губернии" в выдаче всё те же + 10 000. Показывают ВСЕ записи, где есть хоть ОДНО слово из запроса. А если это же в кавычках, выйдет ноль, поскольку шум, ошибки индексирования и т.д . Крайне неудобно. --- Ищу - Антонов Ювеналий Евпсихиевич ( Тамб. губ, Темн.уезд+Краснослободск), Скрябин Иоасаф (Тула+Воронеж.губ), Королёвы (Моск,Тульск губ.), Хелиус (Лифляндия, СПб/Моск губ.), Бабицыны (Уршель\Судогда, Владим.губ), Григорьевы (Смол.губ.-Духовщина,+Москва), Филимоновы (Тульск. губ, Алекс.уезд+Москва) | | Лайк (7) |
| Myk03 Участник
Одинцово, Московская обл. Сообщений: 100 На сайте с 2020 г. Рейтинг: 124 | Наверх ##
4 сентября 2022 11:09 Подскажите, пожалуйста, для непонятливых. Как искать по этому ресурсу? Пишу в поиске: Роман Петров Лазарев, а получаю кучу ссылок, которые даже близко не похожи на запрос. 10000+ И что с этим дальше делать? | | |
| Аталина Пушкино, Московская обл. Сообщений: 1400 На сайте с 2007 г. Рейтинг: 1555
| Наверх ##
4 сентября 2022 11:21 Myk03 написал: [q] Подскажите, пожалуйста, для непонятливых. Как искать по этому ресурсу? Пишу в поиске: Роман Петров Лазарев, а получаю кучу ссылок, которые даже близко не похожи на запрос. 10000+ И что с этим дальше делать?[/q]
А он откуда, известно? Я по своим ищу из Новосильского уезда, Суровской волости. Набираю слово в кавычках, это либо Новосильскаго, либо Суровской, либо фамилию. Далее фильтр: выбор архива. Если, Москва, то выбираю один сорок и ищу по нему, потом другой итд ---
| | Лайк (2) |
| Myk03 Участник
Одинцово, Московская обл. Сообщений: 100 На сайте с 2020 г. Рейтинг: 124 | Наверх ##
4 сентября 2022 11:44 Аталина написал: [q] Myk03 написал:
[q] Подскажите, пожалуйста, для непонятливых. Как искать по этому ресурсу? Пишу в поиске: Роман Петров Лазарев, а получаю кучу ссылок, которые даже близко не похожи на запрос. 10000+ И что с этим дальше делать?
[/q]
А он откуда, известно? Я по своим ищу из Новосильского уезда, Суровской волости. Набираю слово в кавычках, это либо Новосильскаго, либо Суровской, либо фамилию. Далее фильтр: выбор архива. Если, Москва, то выбираю один сорок и ищу по нему, потом другой итд
[/q]
В том то и дело, что неизвестно. Переселился в 1830 г. В Саратовскую губернию. В РС сказано: "Из разных мест" Вот, пытаюсь узнать, из каких. | | Лайк (1) |
| Аталина Пушкино, Московская обл. Сообщений: 1400 На сайте с 2007 г. Рейтинг: 1555
| Наверх ##
4 сентября 2022 13:37 >> Ответ на сообщение пользователя Myk03 от 4 сентября 2022 11:44 Тогда только, "Лазарев" и фильтр по архивам ---
| | Лайк (2) |
| 7_kolen_predkov ДиВанное заМКАДье Сообщений: 1217 На сайте с 2021 г. Рейтинг: 4022
| Наверх ##
4 октября 2022 14:08 4 октября 2022 14:11 Отчитываюсь по месяцу тестирования/использования ресурса. В какой-то момент показалось, что мы с поиском договорились, поняли друг друга, железяка искусственный интеллект сервис пошёл мне навстречу - нашлись записи о паре десятков персон. Затем "поток откровения" сошел на минимум. Не находилось даже то, что ранее уже было в результатах. Может программеры меняют что-то в алгоритмах? Грущу, что из отработанного разработчиками материала архивов по моим предкам представлен только один регион.
| | Лайк (2) |
CathycatМодератор раздела Семейный архивариус  Москва Сообщений: 301 На сайте с 2009 г. Рейтинг: 206 | Наверх ##
6 октября 2022 15:23 7_kolen_predkov написал: [q] Отчитываюсь по месяцу тестирования/использования ресурса. В какой-то момент показалось, что мы с поиском договорились, поняли друг друга, железяка искусственный интеллект сервис пошёл мне навстречу - нашлись записи о паре десятков персон. Затем "поток откровения" сошел на минимум. Не находилось даже то, что ранее уже было в результатах. Может программеры меняют что-то в алгоритмах? Грущу, что из отработанного разработчиками материала архивов по моим предкам представлен только один регион.
[/q]
Да, насколько мне известно, алгоритмы "совершенствуются". Заключила в кавычки, поскольку не все изменения могу назвать усовершенствованиями. Добавился поиск в кавычках, но при этом отпала автоматическая фильтрация при добавлении новых условий. Например, раньше если пишешь "Анна" (без кавычек еще), выдавало +10 000 результатов. Добавляешь в строку "жена/вдова/дочь" - сразу выдача уменьшается вдвое. Добавляешь еще условие - фамилия/отчество/населенный пункт/ословие - остается 200-300 результатов максимум, фильтруешь их по архиву и датам, получаешь вполне нормальное количество записей, не более 50. А теперь этой автоматической фильтрации при уточнении нет. Наоборот, все стало хуже, поскольку при добавлении новых условий добавляются записи, имеющие добавленное слово. То есть к записям со словом "Анна" добавляются записи со словом "жена", "мещанская", "Тульская" и т.д. А поиск в кавычках идет по точному написанию. Учитывая, что почерк разный, нейросеть слово часто читает неправильно, в выдаче прежней это не мешало, поскольку человек анализировать может. И ему понятно, что "Лётр" - "Пётр". Для алгоритма поиска в кавычках это не так, и слово "Лётр" в выдачу не попадет. У меня многие из найденных ранее записей тоже не находятся теперь, с этими нововведениями. А я пользуюсь сервисом с первых дней, то есть еще с зимы. Более того, известные мне по другим ресурсам (FS) многие записи тоже не находятся. Поскольку все записи украинских архивов для скачивания с FS теперь недоступны, а Генотек их тоже видит, хотела через него скачать. Прямым поиском не вышло, вписала в строку данные другой записи с нужной страницы, там почерк лучше. Тогда страница нашлась. В общем, странно... --- Ищу - Антонов Ювеналий Евпсихиевич ( Тамб. губ, Темн.уезд+Краснослободск), Скрябин Иоасаф (Тула+Воронеж.губ), Королёвы (Моск,Тульск губ.), Хелиус (Лифляндия, СПб/Моск губ.), Бабицыны (Уршель\Судогда, Владим.губ), Григорьевы (Смол.губ.-Духовщина,+Москва), Филимоновы (Тульск. губ, Алекс.уезд+Москва) | | Лайк (8) |
VioVita Тула Сообщений: 302 На сайте с 2020 г. Рейтинг: 384 | Наверх ##
8 февраля 2023 21:41 8 февраля 2023 21:44 ГАТО решил вмешаться Нечего Генотеку бесплатно информацию раздавать...
 --- Тульская губ., Епифанский уезд, с. Бахметьево: Родионовы
Рязанская губ., Касимовский уезд, д. Миленино: Филины
Саратовская губ., Балашовский уезд, с. Б. Сестренки: Тураевы
Тверская губ., Бежецкий уезд, Филипковская волость, д. Юркино: Копыловы | | Лайк (1) |
BORISBEL Сообщений: 10336 На сайте с 2012 г. Рейтинг: 11914 | Наверх ##
8 февраля 2023 21:55 VioVita
Распознавание и шифры дел остались. Менее удобно, но не критично. --- в том обыске за ветхостью иатодранием начала нет | | |
| alexander9 Начинающий
Москва Сообщений: 33 На сайте с 2018 г. Рейтинг: 34 | Наверх ##
11 марта 2023 21:44 11 марта 2023 21:45 Похоже, что Генотек, что Яндекс-Архив пока просто играются с распознаванием рукописных текстов, коими являются метрики. Это круто, это невиданно доселе, это огромный шаг вперед. Но... Для нормального архивного поиска этого совершенно, абсолютно недостаточно и даже бесполезно. Ибо структурированный поиск сделать невозможно, а вручную просматривать мусор из 10,000+ результатов - лучше уж не ломая глаза обратиться к исходным сканам и просмотреть их глазами.
Прорыв вперед будет, когда систему научат разбирать метрики на поля, подключать справочники, после чего можно будет искать например "Иван Иванов Иваново" именно как : имя = Иван, Фамилия (или отчетство, если захотим) = Иванов, населенный пункт приписки или рождения = Иваново.
А пока что просто игрушка, увы.
Приятно выглядит Сфера-Находка. И разбор по полям есть и еще много чего, заточенного именно на архивы, их документы и специфику, поиск, архивную работу. Но она не делает публичных сервисов, как Генотек или Яндекс. | | |
|