2007.04.12 Thursday

HTMLのパース

まずは、サンプルサイト
DeepRSS
をご覧ください。
このサンプルサイトは、単一RSSファイルを解析し、RSSが持っているリンク先の内容を取得し、UIで指定した、開始マークから終了マーク間のデータを表示する、というサンプルです。
サンプルとして作ったものなのですが、意外と実用性が高くて、個人的に使っています。
ニュースサイトのRSSでは、概要しか配信してくれないので、全文が一気に見れて、なかなかGoodです。
続きを読む>>

2007.04.08 Sunday

文字列中の相対パスを絶対パスに変換

文字列中の相対パスを絶対パスに変換する方法をメモ。

例えば、
文字列が
$cdata = '<img src="images/fuga.jpg" class="pict" alt="" width="240" height="400" />
<p>本文</p>';

と与えられた場合、そのページ以外からは画像の表示が出来ないので、絶対パスに変換してあげる必要があるわけです。
RSSというのは、自分以外のページからコールされるのが基本なので、RSSに相対パス状態で情報を格納するのはどうなんだ?
というのはありますが、現実としてこういうフィードがあるのは事実なので、使う側で何とかしてあげないと、どうにもなりません。
ときおり、特定のRSSリーダーだけで特定のフィードの画像が表示されない、というのは、こういう理由からです。
また、外部サイトからの画像読み込みを禁止しているサイトもあるので、そういうところは、どうにもなりませんが・・・
続きを読む>>

2007.04.05 Thursday

自然文検索に対応したOkSearchAPI

OK TellMe
というウェブサイトがあるのですが、ここで利用できるのが、自然文検索(話し言葉による入力)による検索。
検索対象は、QAサイトである、OKWaveのデータです。
あわせて、ウェブプログラマ向けにAPIの仕様が公開されているので、サンプルページを作ってみました。
自然文検索に対応したOkSearchAPIのサンプルページ
続きを読む>>

2007.04.04 Wednesday

RSSリーダーを作る

RSSリーダーを作る、といっても、高機能なものを作るわけでなければ、
比較的簡単に、かつ、自分に必要な機能を備えるRSSリーダーが出来ます。
WX320Kを購入してから、OperaサーバーサービスのRSS機能を使用していたのですが、登録したフィードが消失したり、途中までしか読み込まなかったり、一部のフィードの登録が出来なかったり、背景色が黒で現在のUIにあっていない、本文の文字サイズが微妙に小さくて拡大率がアバウトな関係もあって読みにくい、などなど、様々な問題点があったので、このOperaサーバーサービスのRSS機能の代用が目的です。

自分で作れば、背景色や文字サイズだけでなく、表示内容も自分の好きなように出来ます。

続きを読む>>

2007.04.02 Monday

指定文字列に挟まれた文字列を返す

例えば、
1位 「黄砂」 2位 「ソロモン諸島」 3位 「ハンゲーム」 (2007年4月2日 10時 )

という文字列があったとします。
この文字列から、「」に挟まれた文字列を取得する方法を考えてみます。

単に、文字列Aと文字列Bの間に挟まれた文字列Cを取得したければ、
preg_match
を使うのが一番簡単ですが、初心者は正規表現の扱いに慣れていない方が多いでしょうから、strposとsubstrを組み合わせて作ってみます。
(正規表現を使った例もページの最後で紹介しておきます)

--
続きを読む>>
1/1