Скачивание материалов с Familysearch.org
Инструкции
miliam г. Дубна Сообщений: 697 На сайте с 2012 г. Рейтинг: 519
| Наверх ##
17 марта 2017 18:18 Пожалуйста, подскажите, как скачать материалы с сайта не пространство тыкая, а массивом? Допустим, есть метрическая книга, в ней 400 листов. Нужно скачать все или частично. Как это сделать? Некоторые пишут, что на сайте есть даже инструкции на эту тему, однако, их найти проблематично. Будет полезно иметь их здесь, в отдельной теме. Спасибо.
tsamosaver написал: [q] FS Film Trawler - Расширение Chrome для сбора ссылок на кадры с FamilySearch
[/q]
euhome написал: [q] Скрипт GetFilmsByDGS.htm на основе номера пленки генерирует ссылки на изображения, которые можно затем загрузить.[/q] | | Лайк (2) |
Mantikore Нижний Новгород Сообщений: 130 На сайте с 2013 г. Рейтинг: 156 | Наверх ##
26 апреля 2017 12:09 26 апреля 2017 12:24 klower написал: [q] Браузер Firefox 52.0.1[/q]
Да, в Firefox я не тестировал. Вот этот код будет работать в обоих браузерах: [q] var b=document.getElementsByClassName('next pager-icon fs-civ-circle-chevron-right enabled' )[0]; var l=document.createElement("a");var t=document.getElementById('image-citation' );var rn=true; function d(){l.href=document.getElementById('printImage' ).src;l.download=document.getElementsByClassName('thumbnail-selection' )[0].title+(rn?(" "+t.innerHTML.substring(t.innerHTML.lastIndexOf(")")+3,t.innerHTML.lastIndexOf(" image")).replace(/[\]\[>/|\"*?<]|(> )|(< )/gi,"")):"")+".jpg";document.body.appendChild(l);l.click();document.body.removeChild(l);}; function e(e){if(e.fireEvent){e.fireEvent('onclick' );}else{var o=document.createEvent('Events' );o.initEvent('click',true,false);e.dispatchEvent(o);}}; function s(t){setTimeout(function(){d();e(b);rn=false;if(!document.getElementsByClassName('next pager-icon fs-civ-circle-chevron-right enabled disabled' )[0]){s(!t);}},4000)}; console.log = function(m){if(m.indexOf("GetImageData")>=0)rn=true;} s(true);[/q]
Небольшое дополнение. В предпоследней строке указан таймаут между операциями(4000 = 4 секунды). Из-за низкой производительности сайта FamilySearch (либо вашего компьютера) может возникнуть ситуация, при которой свойство элемента 'image-citation' не успевает обновиться за этот промежуток времени. Из-за этого к названию файла может не подтянуться описание. Если вы это наблюдаете, или хотите обезопасить себя от таких ситуаций, просто увеличьте таймаут (10000 хватит наверняка, но, соответственно, скорость работы уменьшится) --- Семеновские, Введенские, Чистопольские, Шлюпневы, Поляковы (Нижегородская губерния) | | Лайк (1) |
klower Новичок
Сообщений: 16 На сайте с 2013 г. Рейтинг: 15 | Наверх ##
27 апреля 2017 15:28 Огромное вам спасибо! Всё заработало! | | |
Виктор_В Новичок
Москва Сообщений: 19 На сайте с 2008 г. Рейтинг: 19 | Наверх ##
2 мая 2017 17:33 Автокликер не очень удобен, решил попробовать скрипт, Google Chrome Версия 58.0.3029.81 на двух разных компьютерах результат одинаковый пробовал скачать: https://familysearch.org/searc...cat=785139Собственно процесс скачивания не стартует, открывается куча окон "Сохранение" потом нужно кликать мышкой в кнопку "Сохранить" Какие-то странные наименования файлов: Изображение 1 из 936 .jpg Изображение 2 из 936 .jpg Изображение 3 из 936 .jpg Изображение 4 из 936 .jpg Изображение 5 из 936 .jpg Изображение 6 из 936 image 474 of 563; государственных архивов Татарстан (Tatarstan National Archive, Kasan)..jpg Изображение 7 из 936 image 475 of 563; государственных архивов Татарстан (Tatarstan National Archive, Kasan)..jpg Изображение 8 из 936 image 476 of 563; государственных архивов Татарстан (Tatarstan National Archive, Kasan)..jpg Изображение 9 из 936 image 477 of 563; государственных архивов Татарстан (Tatarstan National Archive, Kasan)..jpg Изображение 10 из 936 image 478 of 563; государственных архивов Татарстан (Tatarstan National Archive, Kasan)..jpg Изображение 11 из 936 image 479 of 563; государственных архивов Татарстан (Tatarstan National Archive, Kasan)..jpg | | |
Tanta Люберцы Сообщений: 162 На сайте с 2010 г. Рейтинг: 141 | Наверх ##
2 мая 2017 18:16 2 мая 2017 18:20 Виктор_В, думаю проблема в том, что в настройках браузера про папку сохранения (по умолчанию -папка "загрузки") вас стоит галочка (не помню точно) что-то вроде "спрашивать каждый раз..." Уберите ее и будет скачиваться автоматически, без уточнения, в курсе ли вы, куда скачиваете. У меня было подобное. П.с если Вы про вариант от Mantikore. --- Кулаков,Кузьмин-Твер.обл, д.Дмитрово(Твер. уезд, приход с.Астраганец), д.Попово ныне Старицкого у.
Плешаков,Харламов,Лебедев,Непримеров - Волгогр.обл.// | | |
Виктор_В Новичок
Москва Сообщений: 19 На сайте с 2008 г. Рейтинг: 19 | Наверх ##
2 мая 2017 19:16 Mantikore написал: [q] [/q]
Tanta написал: [q] [/q]
Спасибо! | | |
Олинка Кемерово Сообщений: 808 На сайте с 2007 г. Рейтинг: 695 | Наверх ##
3 мая 2017 4:49 Mantikore написал: [q] var b=document.getElementsByClassName('next pager-icon fs-civ-circle-chevron-right enabled' )[0]; var l=document.createElement("a");var t=document.getElementById('image-citation' );var rn=true; function d(){l.href=document.getElementById('printImage' ).src;l.download=document.getElementsByClassName('thumbnail-selection' )[0].title+(rn?(" "+t.innerHTML.substring(t.innerHTML.lastIndexOf(")")+3,t.innerHTML.lastIndexOf(" image")).replace(/[\]\[>/|\"*?<]|(> )|(< )/gi,"")):"")+".jpg";document.body.appendChild(l);l.click();document.body.removeChild(l);}; function e(e){if(e.fireEvent){e.fireEvent('onclick' );}else{var o=document.createEvent('Events' );o.initEvent('click',true,false);e.dispatchEvent(o);}}; function s(t){setTimeout(function(){d();e(b);rn=false;if(!document.getElementsByClassName('next pager-icon fs-civ-circle-chevron-right enabled disabled' )[0]){s(!t);}},4000)}; console.log = function(m){if(m.indexOf("GetImageData")>=0)rn=true;} s(true);
Небольшое дополнение. В предпоследней строке указан таймаут между операциями(4000 = 4 секунды). [/q]
Все замечательно работает, 4 секунды маловато, поставила 9. Медленно, но верно все качает, в субботу скачала 3 дела по чуть больше 1000 снимков без какой-либо блокировки. Спасибо большое создателю!!! --- Дневник http://forum.vgd.ru/891/
ZF1192774 (Gedmatch)
Бушуев, Пальцев, Сафронов/Федотов/Казаков, Панфилов, Кулагин, Кочетков, Воронин, Отцын/Оцинов, Мурзаев, Тюкин/Кырмагин, Пучинин, Мерзляков, Полатов, Хлебников, Пермяков, Кудриков, Седых, Лазарев, Босенко, Омельченко, Мороз, Манякин, Кубушка, Б | | |
Tanta Люберцы Сообщений: 162 На сайте с 2010 г. Рейтинг: 141 | Наверх ##
3 мая 2017 6:03 Олинка написал: [q] Все замечательно работает, 4 секунды маловато[/q]
У меня нормально всё. Т.ч сначала пробуем как есть, а при необходимости увеличиваем. Каждый настраивает время под себя, если нужно. --- Кулаков,Кузьмин-Твер.обл, д.Дмитрово(Твер. уезд, приход с.Астраганец), д.Попово ныне Старицкого у.
Плешаков,Харламов,Лебедев,Непримеров - Волгогр.обл.// | | |
Олинка Кемерово Сообщений: 808 На сайте с 2007 г. Рейтинг: 695 | Наверх ##
3 мая 2017 13:29 3 мая 2017 13:31 Tanta, я конкретно про себя и написала))) 4 мне оказалось мало, все картинки сохранял как первую, т.е. куча одинаковых картинок, на 8 почему-то съедает названия у некоторых файлов.... хотя на скорость никогда не жаловалась.
Решила для себя, что лучше медленно, но верно. А у кого на 4 летает, я только порадуюсь)) --- Дневник http://forum.vgd.ru/891/
ZF1192774 (Gedmatch)
Бушуев, Пальцев, Сафронов/Федотов/Казаков, Панфилов, Кулагин, Кочетков, Воронин, Отцын/Оцинов, Мурзаев, Тюкин/Кырмагин, Пучинин, Мерзляков, Полатов, Хлебников, Пермяков, Кудриков, Седых, Лазарев, Босенко, Омельченко, Мороз, Манякин, Кубушка, Б | | |
Tanta Люберцы Сообщений: 162 На сайте с 2010 г. Рейтинг: 141 | Наверх ##
3 мая 2017 14:24 Олинка написал: [q] [/q]
понимаю, поэтому написала для других, чтоб не пугались сразу и сначала пробовали как есть --- Кулаков,Кузьмин-Твер.обл, д.Дмитрово(Твер. уезд, приход с.Астраганец), д.Попово ныне Старицкого у.
Плешаков,Харламов,Лебедев,Непримеров - Волгогр.обл.// | | |
КорифейУчастник  Сообщений: 35 На сайте с 2014 г. Рейтинг: 26 | Наверх ##
3 мая 2017 20:42 Mantikore,
спасибо за отличный скрипт.
Работает "на ура"! Гениально! Поклон до земли!
Вопросик. Я использую ту самую улучшенную модификацию скрипта что позволяет получать понятное и полезное имя файла, что вы сами нам разьяснили и опубиковали. Не хочу занимать место в посте, но тот скрипт что содержит манимуляции "(" image")).replace(/[\]\[>/|\"*?<]/gi,"")+".jpg";l.click();};"
Однако на выходе получаю файлы вот с такими именами: record-image_3QS7-L975-69WT-R record-image_3QS7-L975-694D-R record-image_3QS7-L975-694J-1 record-image_3QS7-L975-694M-C
Я наверное что-то делаю не так? что это может быть? --- Все вопросы задаются искренне, иронию и сарказм на форуме не использую. | | |
|