勝手に改造-Web::Scraperではてブスクレイピング

2009年3月 5日
| コメント(0) | トラックバック(0) 勝手に改造-Web::Scraperではてブスクレイピング

自分のブログをブックマークしてくれた人のはてなダイアリーのリストを返すスクリプトがあった。

Web::Scraperではてブスクレイピング

しかし、リニューアル後のはてなには対応していなかったので、勝手に改造して使うことにした。
…まあ、ダイアリーやってない人も多いんだけどね。

ソースコード。

use strict;
use warnings;
 
use URI;
use Web::Scraper;
use List::MoreUtils qw/uniq/;
 
my $uri = URI->new('http://b.hatena.ne.jp/bookmarklist?url=http://weblog.nqou.net');
 
my $scraper = scraper {
    process '//ul[@class="comment"]/li/a[1]', 'users[]' => '@href';
    result 'users';
};
 
my $res = $scraper->scrape($uri);
 
print join "\n", map { s/b.hatena/d.hatena/;$_} uniq(@{$res});

トラックバック(0)

このブログ記事に対するトラックバックURL:

コメントする

Google検索

Last.fm

このブログ記事について

このページは、のぶりんが2009年3月 5日 23:05に書いたブログ記事です。

ひとつ前のブログ記事は「WWW::MechanizeとWeb::ScraperでLast.fmからfreemp3をダウンロードする」です。

次のブログ記事は「Kansai.pm第11回ミーティングに行ってきます(予定)」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。

Creative Commons License
このブログのライセンスは クリエイティブ・コモンズライセンス.
Powered by Movable Type