AutoPagerizeのSITEINFOを書きたい

screenshot
巡回先の一つである♪chをAutoPagerize(自動ページめくり)させたいと思って苦心しているのだが…。
AutoPagerize用のXPathをかんたんに作るためのブックマークレット AutoPagerize IDE - bits and bytes
http://labs.gmo.jp/blog/ku/2007/07/autopagerizexpath_autopagerize_ide.html
早速このブックマークレットを登録してやってみたけど…なんかうまくいかない。
SITEINFOの書き方とか記述方法が知っている人にとっては使えるツールだけど、誰でも使える簡単ツールじゃないようだ。

この便利さを生んでくれる、SITEINFOの書き方を、

otsuneさんに教えていただいた。

SITEINFOを書くときは、XPathを楽に作れるブックマークレットを使う。

* AutoPagerize IDE

http://labs.gmo.jp/blog/ku/2007/07/autopagerizexpath_autopagerize_ide.html

AutoPagerizeに対応したいWebサイトを見つけたら、作業開始。

出力されたコードは、基本的に以下を編集して貼り付ける。

* SITEINFO避難所

http://wiki.fdiary.net/temp/?SITEINFO%C8%F2%C6%F1%BD%EA

そうすると、職人の方が以下に清書してくれる。

* AutoPagerize (swdyh)

http://swdyh.infogami.com/autopagerize

AutoPagerizeのインストールからSITEINFOの記述まで - Overlasting::Hatena

避難所も今は無くなっている。





AutoPagerizeで自動ページ送りさせるには、各々のページにSITEINFOと呼ばれる設定情報を各必要があって、おおむね以下の情報を指定する必要があるらしい。

まずページのURLアドレス(url:)と、
次のページをめくるリンクはどこか(nextLink:)
ページの本文はとはどこからどこまでか(pageElement:)
ページを割り込ませるのはどこからか(insertBefore: )

これらの情報の記述はxpathと呼ばれる書式で指定するのだが…。xpathて何だっけ?

XML Path Language (XPath; XMLパス言語) は、マークアップ言語 XML に準拠した文書の特定の部分を指定する言語構文である。

XML Path Language - Wikipedia

…というものらしい。

AutoPagerize IDEでうまくいかないのは、XML準拠のxhtmlになっていない昔ながらのの?htmlだからのようだ。

避難所の移転先にあった、
AutoPagerize Wiki: How to write SITEINFO (ja)
http://autopagerize.jottit.com/how_to_write_siteinfo_(ja)
や、そこからリンクされていた。
SITEINFOのnextLinkケーススタディ - 0x集積蔵
http://d.hatena.ne.jp/os0x/20080204/1202112958
を見よう見まねでnextlinkまでは書けた。あとはPageelementなんだよなぁ


ふたばの画像掲示板も同様なHTMLソースだけどAutopagerizeできているんだよなぁ。

url:          http://[^\.]+.2chan.net/.*
nextLink:     //form[contains(@action,".htm")][last()]
insertBefore: //form[1]/hr[last()]
pageElement:  //form[1][@action="futaba.php"][contains(text(),":")]/*[not(self::table[contains(@align,"right")])]
棚からパルチャギ■E-shuushuuとふたばのAutoPagerize SITEINFO

すごい、xPathてそういうのも指定の仕方もできるんだ…て、さっぱりワケワカランなぞの暗号だ(。