Node.jsで任意のWebsite画像のURLを取得したい場合は下記のように記述します。
script.js
var client = require('cheerio-httpcli');
var URL = require('url');
var Website = "https://day-journal.com/blog/";
var para = {};
var src;
var answer;
client.fetch(Website, para, function(err, $, res) {
if (err) { console.log("error"); return; }
$("img").each(function(idx) {
src = $(this).attr('src');
answer = URL.resolve(Website, src);
console.log(answer);
});
console.log("\n" + "画像のURLが表示されました。");
})
script.jsを実行すると下記のようにコマンドプロンプトに表示されます。
HTMLをjQueryライクにパースしてくれる「cheerio-httpcli」モジュールとパスを操作する「url」モジュールを利用することで手軽に取得することができます。
- 参考文献
[![JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック](http://ecx.images-amazon.com/images/I/61DHJGf1uSL._SL160_.jpg)](http://www.amazon.co.jp/exec/obidos/ASIN/4883379930/dayjournal-22/ref=nosim/)
[JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック](http://www.amazon.co.jp/exec/obidos/ASIN/4883379930/dayjournal-22/ref=nosim/)