dayjournal memo

Total 992 articles!!

Node.js #001 – 画像のURL取得

Yasunori Kirimoto's avatar

Node.jsで任意のWebsite画像のURLを取得したい場合は下記のように記述します。


script.js


var client = require('cheerio-httpcli');
var URL = require('url');

var Website = "https://day-journal.com/blog/";
var para = {};
var src;
var answer;

    client.fetch(Website, para, function(err, $, res) {
        if (err) { console.log("error"); return; }

        $("img").each(function(idx) {
            src = $(this).attr('src');
            answer = URL.resolve(Website, src);
            console.log(answer);
        });
        console.log("\n" + "画像のURLが表示されました。");
    })

script.jsを実行すると下記のようにコマンドプロンプトに表示されます。

node.js_001_01


HTMLをjQueryライクにパースしてくれる「cheerio-httpcli」モジュールとパスを操作する「url」モジュールを利用することで手軽に取得することができます。



book

Q&A


  • 参考文献
[![JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック](http://ecx.images-amazon.com/images/I/61DHJGf1uSL._SL160_.jpg)](http://www.amazon.co.jp/exec/obidos/ASIN/4883379930/dayjournal-22/ref=nosim/)
[JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック](http://www.amazon.co.jp/exec/obidos/ASIN/4883379930/dayjournal-22/ref=nosim/)