ブログが続かないわけ

この日記のはてなブックマーク数
Webエンジニアが思うこと by junichiro on Facebook

Web::Scraper を使ってURL からtitle を含んだ a タグを作成する

このエントリーを含むはてなブックマーク hateb

タイトルの通りです。先日、Emacs でブログを書くときの補助ツールとして、URL から「タイトル付きのa タグを生成する」方法を紹介しました。そのときは、LWP 系が動かないというわけのわからないトラブルがあったため、WWW::Curl を使ったのですが、もともとはURI::Title を使っていました。

[参考] URI::Title が動かなくなったので代替手段を探った | ブログが続かないわけ

スクレイピングをするときにはいつでも問題になる文字コードですが、それはここでも例外ではありませんでした。そこで、文字コードの問題を内部的に解決できていて、かついろいろとつぶしが効くWeb::Scraper を使ったほうがいいと教えて頂いたので、それを使うことにしました。

Twitter / トミール: @jun_ichiro URITitleを覚えておく ...

@jun_ichiro URITitleを覚えておくくらいならW:Scraper覚えておいた方がつぶしがきくとか、lwpベースならdecoded_contentが自動判別ルーチンを持ってるから(EncodeGuessという大失敗作使う必要ない)とか色々言いたいので本を買うように!

Web::Scraper はもともと結構使っていたので、あっという間にできました。

標準入力からURI を受けつけて、a タグを標準出力に吐きだすだけです。

Web::Scraper 版にするときについでに、複数行のURL を処理できるように修正しました。

これ、ホントに便利なので、使用イメージを伝えたいと思い、7秒ほどの動画を作りました。埋め込みじゃなくて申し訳ないのですが、是非ご覧ください。

Emacs でURL から a タグに変換する動画

Web::Scraper の使い方は下記を参考にしてください。

この記事のトラックバックURL
http://en.yummy.stripper.jp/trackback/1418076
トラックバック
コメント









関連情報