生涯未熟

生涯未熟

プログラミングをちょこちょこと。

PHP×Snoopy×スクレイピング

Snoopyという面白いライブラリを発見したので色々とまとめてあるサイトをさらにまとめてみようかと。

これら以外はあまり情報が見つかりませんでした。
Snoopyがあまり使われていない理由は同じ機能を持つものが存在しちゃったりするからでしょうかね。

調べてみたところどうやらSnoopy単体よりかhtmlsqlとセットで使用されちゃったりしてるのですな。(htmlsqlをダウンロードするとSnoopyもセットで付いてきます)

htmlsqlについては、

など他にも情報が盛り沢山あります。
で、先に述べたとおりスクレイピングクローラーの類はSnoopy単体よりもhtmlsqlとのセットで使われているので、ソース探しもこれを目安に探せばいいのかも。


このhtmlsqlは名前の通りSQLライクに書くのですが、他にもjQueryライクに書くPHP Simple HTML DOM Parserなんてのもあるみたいです、多分手は出しませんが。



という訳で、使い勝手が良さそうなこれらを使って何かを作るかも。