website mirroring, снова
Jul. 4th, 2010 07:23 pmговно этот ваш wget, товарищи.
он, конечно, качает, но:
* далеко не всё (-r –p –l inf и прочие опции делают вид что работают, проблема в другом)
* это самое “не всё” выбирается по откровенно непонятному мне признаку. на странице 10 ссылок, из них зафолловлены 1,2, 5, 7 и 10. как это, интересно, называется?
перезапускал, он каждый раз чтото докачивает еще, фолловит еще небольшое подмножество линков, радостно говорит Completed и останавливается.
причем, ладно медиавики, оно даже сайт из тупых статичных штмлей правильно стащить не может! в пределах одной сессии! ничтожных 100к страниц! я в печали. пойду тыкать другие софтинки.
no subject
Date: 2010-07-04 04:24 pm (UTC)no subject
Date: 2010-07-04 04:30 pm (UTC)no subject
Date: 2010-07-04 05:03 pm (UTC)no subject
Date: 2010-07-04 05:08 pm (UTC)no subject
Date: 2010-07-04 07:57 pm (UTC)no subject
Date: 2010-07-04 04:25 pm (UTC)no subject
Date: 2010-07-04 04:25 pm (UTC)no subject
Date: 2010-07-04 04:28 pm (UTC)когда-то было. может уже пофиксили.
no subject
Date: 2010-07-04 04:29 pm (UTC)no subject
Date: 2010-07-04 04:40 pm (UTC)no subject
Date: 2010-07-04 07:02 pm (UTC)Это что-то малоправдоподобное.
А можно дать пример сайта, где возникают проблемы, с указанием ссылки, которые должна была бы скачаться,
но не скачивается?
no subject
Date: 2010-07-04 09:21 pm (UTC)no subject
Date: 2010-07-05 04:29 am (UTC)Вы можете получить этот файл только если посетите сайт наших
рекламодателей помогающих оплачивать наши сервера и каналы.
Неудивительно. Сайт с извращениями, там может быть все что угодно, вплоть до защиты от активных качальщиков.
no subject
Date: 2010-07-05 06:17 am (UTC)no subject
Date: 2010-07-04 09:15 pm (UTC)no subject
Date: 2010-07-04 09:45 pm (UTC)no subject
Date: 2010-07-05 01:23 am (UTC)no subject
Date: 2010-07-05 08:03 pm (UTC)no subject
Date: 2010-07-06 08:09 am (UTC)no subject
Date: 2010-07-05 08:02 pm (UTC)Могу дать свой файлик на стописят строк которым я вытаскивал svn репозитории через вебморду со скуки, пока одмин тупил и не мог мне права выдать. Его, натурально, придётся допиливать, но хотя бы эти 150 строк ты сможешь не писать сам! О, а ещё я с его же помощью тянул музычку когда wget обламывался с именами кириллицей, так что он даже довольно няшно структурирован в результате.
Кстати, подумал о том, что надо бы потребовать у тебя его взад с модификациями -- так может уже есть множество написанного где-то в гитхабах и битбакетах? Типа, нечто, изначально рассчитанное на программистов и только на них, поэтому на первый взгляд не заметное!