XPathとは

XPathで検索すると、W3Cの文書がひっかかった。

XPath is a language for addressing parts of an XML document, designed to be used by both XSLT and XPointer.

XMLで記述された文書の一部を指定するための言語、ということみたい。百聞は一見にしかず、ということでまずは実際に使ってみる。
FireFoxだとXPath Checkerがよさそう。インストールすると、コンテキストメニューにView XPathが追加される。
http://static.flickr.com/112/261598501_a1d4a1029c.jpg
View XPathを選択すると、別ウィンドウでXPath Checkerが起動する。あとはXPathのところにXPathを記述すれば、出力が得られる。
これはドキュメントルート配下のimgを全部出力した例。
http://static.flickr.com/117/261598503_be79bf1651.jpg
Filter::EntryFullTextのHandlerが楽しく書けそう。正規表現と比べると多少動作が重たいのが気になるところかな?しばらくXPathを使ってみよう。
ちなみに、最近の業界ではCSSセレクタからXPathを生成するのが流行らしい。