とあるWebサイトでたまに使うのでmemo。やり方なんていっぱいあるんだけどね。べ、別にエロ画像集めてるわけじゃありませんよ!
- curlでhttpアクセス
- grepでIMGタグの行を抽出
- それをsedで置換してファイル名の部分だけ取得
- 絶対パスに置換するために http://を補完する
- これで全ファイル名が出てくるので、xargsとwgetで全DLする
みたいな。
$ curl http://example.com/ | sed -e 's/.*src=//' -e 's/ alt.*//' -e 's\^\http://example.com/\' | xargs wget
後で気付いたけど、ソースもwgetで取ってきたほうが楽だ
ちなみに連番のファイルだったら、zshとwgetコンビの超有名な技がありますね。
$ wget http://example.com/img/gazou{000..100}.jpg
的な感じの。あぁエロい。