コメント収集

あらかじめブログを登録しておいて、その中のある特定のハンドルで書き込まれたコメントを自動収集してくれるようなシステムってできないのかなぁ、、(もちろんガクシザーさん米ヲチが頭にあるわけですが)。各ブログシステムやデザインによって最新のコメント欄がまちまちなのでアンテナ拾いの eye grep って結構面倒なのよね。RSSとかでもコメントまではitem の中に入ってないよね。。。

各ブログのインタフェースの差異を吸収するようなアダプタ作って、最近のコメントを抽出するようなリクエストを投げるとブログごとにその部分を抽出して(もしそういうリクエストに対応してたらそれ使って)最新順に並べる、とかできないかなぁ。

たとえばはてなだと(hatena-recentcomment を使っていれば)

<div class="hatena-module">
<div class="hatena-moduletitle">最近のコメント</div>
<div class="hatena-modulebody">
<ul class="hatena-recentcomment">
<li><a href="/myhoney0079/20070311/p2#c1173955871">2007-03-11</a>&nbsp;clone</li>
<li><a href="/myhoney0079/20070313/p5#c1173883595">2007-03-13</a>&nbsp;厘斗</li>
<li><a href="/myhoney0079/20070313/p4#c1173882478">2007-03-13</a>&nbsp;厘斗</li>
<li><a href="/myhoney0079/20070308/p4#c1173810025">2007-03-08</a>&nbsp;myhoney0079</li>
....
<li><a href="/myhoney0079/20070308/p7#c1173585375">2007-03-08</a>&nbsp;静流</li>
</ul>
</div>
</div>

ってな風に出力される(はず;デザインが違うとダメか?)ので、HTML parse してhatena-recentcomment内をうまくごにょごにゅすればできるような。

でも class とか id で明示的に指定していない HTMLを吐くブログはダメかなぁ、、、つか XML 吐かんのか。