Node.jsでRSSを取得したい場合は下記のように記述します。
script.js
var client = require('cheerio-httpcli');
var RSS = "http://news.yahoo.co.jp/pickup/computer/rss.xml";
var answer;
client.fetch(RSS, {}, function(err, $, res) {
if (err) { console.log("error"); return; }
$("item > title").each(function(idx) {
answer = $(this).text();
console.log(answer);
});
console.log("\n" + "RSSのタイトルを取得しました。");
})
script.jsを実行すると下記のようにRSSのタイトルがコマンドプロンプトに表示されます。
HTMLをjQueryライクにパースしてくれる「cheerio-httpcli」モジュールを利用することで手軽にRSSが取得できます。
日付を取得:
$("item > pubDate").each(function(idx) {
answer = $(this).text();
console.log(answer);
})
- 参考文献
[![JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック](http://ecx.images-amazon.com/images/I/61DHJGf1uSL._SL160_.jpg)](http://www.amazon.co.jp/exec/obidos/ASIN/4883379930/dayjournal-22/ref=nosim/)
[JS+Node.jsによるWebクローラー/ネットエージェント開発テクニック](http://www.amazon.co.jp/exec/obidos/ASIN/4883379930/dayjournal-22/ref=nosim/)