dapper のように、ブラウザでクリックをしたところをスクレイプする、というときにはXPathが向いています。ブラウザでクリックした部分のXPathをサーバに保存しておけば、あとで保存したXPathに従ってドキュメントからエレメントを取り出すことができます。 しかし実際にHTMLからXPathを使ってエレメントを取り出すときに大きな問題になるのが、ウェブページの大半(体感で70%くらい)は記述されているHTMLが構造的に壊れているという事実です。タグを開いたまま閉じていなかったり、開いていないものを閉じていたり、ドキュメントの最後に</body></html>が二重に入っていたり、壊れかたは様々ですが、とにかくウェブ上のHTMLは大半が壊れています。壊れているHTMLが大半だからなのか、壊れているHTMLでもブラウザが適当に解釈して表示してくれるからなのか、とにかく世の中のヘージの大半
[追記]大事な手順を書き忘れていました。セルの再利用のための手順を最後に追記しています。 間違ってるかもしれないけど、たぶんこう。 View Templateを選択して、新しいXIBファイルを作成します。 もともとのViewを削除します。 代わりにUITableViewCellを配置します。 適当にセルをデザインします。 名前を付けて保存します。ここではFeedListCell.xibとします。 Xcodeで対応するUITableViewCellを継承したクラスと、View Controller (FeedListCellController) を作ります。 View ControllerはUIViewControllerを継承します(UITableViewControllerではない)。 また、セルをインスタンス変数として保持します。ここではFeedListCellのインスタンスです。
iPhoneアプリのバイナリは.ipaをunzipすること以外はふつうのアプリのバイナリと同じです。 iPhone内蔵の写真を見るアプリのUIはSDKで提供されていない。 でもChanelのアプリがおんなじような見た目とUIを持っていたのを思い出して(ほかにも同じようなUIを持っているやつあったんだけど思い出せない。知ってたら教えてください)ダウンロードしてきた。こうして大きな画面で並べてみるとボタンの透明度(というか白い部分の明るさ)とか違っててひとめで同じものではなさそうなのがわかりますね… で、いじってみるとChanelのとiPhoneについてるやつは動作が違うので別物なのがわかった。Chanelのやつのほうは変なことをした時にわりと変な動作をする。でももしかして何かヒントがあるかもしれないので、このChanelのアプリの中身がどうなってるのか知りたい。 .ipaをunzipする i
iviewはAppStoreでダウンロードできます(日本のAppStoreでもちゃんとダウンロードできるようになりました)。 Tumblrでdashboardingするためのアプリケーション iviewはtumblrのdashboardで写真を見たりreblogするためのiPhoneのアプリケーションです。iviewは裏であらかじめ次のページ(とその次のページとその次くらいまで)をダウンロードするので、イライラさせられることなしにNextボタンを押すだけでdashboardをno-overheadで眺めながらreblogすることができます。 reblogしたい写真にであったときにはreblogボタンを押すだけであなたのtumblrアカウントにreblogすることができます。reblogボタンを押したらあとは全部裏側でやってくれるので、そのままdashboardingし続けることができます。
こないだ MechanizedSeleniumでtwitterからnowaに投稿 を作ったときにメモったままそのままにしてたのを投稿。 perlだと DateTime::Format::* を使って my $str = "Tue, 01 May 2007 03:08:27 +0000"; my $dt = DateTime::Format::HTTP->parse_datetime($str); $dt->>epoch; で全部解決だけど日付フォーマットの名前がわからないとどのモジュールを使えばいいのかわからない。というわけでメモ。 DateTime::Format::HTTPのドキュメントにいくつかのフォーマットとその名前がリストされていてわかりやすかったです。 ISO8601 2006-11-22T18:37:34+0000こんなやつ。XMLRPCで日付を渡すときに使います。 My
前回に引き続き、自分がよくあるブラウザ上での単純作業をFirebugコンソールで片付けている方法の紹介です。前回はブラウザに表示されているデータをこっち側に持ってくる作業をどうやっやるかでした。今回はブラウザの向こう側のデータをFirebugで操作するにはどうするかです。 ボタンをクリックさせる ウェブのサービスを使っていて、今までに投稿したものを全部消したくなったり(でもアカウントは消したくないとか)することがあります。管理画面で投稿を消すことはできるけど、いちいちクリックしていかないといけなくて面倒.... という時にはFirebugでフェイクのクリックイベントを作って送れば、自動でクリックさせることができます。 Twitterのfavoritesを全部外したい、というのを例としてあげます。TwitterのfavoritesはAPIがあるのでAPIを使う手もありますが、サービスによって
最近の中学生のはじめてのプログラミング言語がJavaScriptだったりするこの時代、最も使いやすいJavaScriptの実行環境であるFirebugは現代のコマンドラインです。UNIXコマンドラインでgrepやuniqを使って、日常の細々した処理を行うのと同じようにFirebugとjavascriptを使いこなせると、日常作業のちょっとしたことをさくっとこなすことができます。ちょっとした作業だから手作業でやってもいいけど自動でやればミスったりしないし、気分的には楽なので自動でやりたい、という作業がけっこうないでしょうか。例えば、ページの中の特定の部分の文字列をリストにしてテキストファイルに保存したい、とか。 そこで今回は私が普段よくやっている単純作業をFirebug+javascriptでさくっとかたづける方法を2回にわけてご紹介します。 ページの中からテキストや属性の値を拾う ページの
web2.0 時代のジョブキューサーバー Gearman と TheSchwartz の関係について - TokuLog 改めB日記に書かれているとおり、Gearmanは仕事を投げられたらすぐやって返す前提になっていて今やりたくないけどあとでやるみたいなのができません。 たとえば、10分後にならできるんだけど、という仕事が来たとします。 このときGearmanのワーカの中でsleepして10分待つと、後から来たほかの仕事を一切しないで10分待つことになってしまって、後から来た仕事が今すぐできるものだったとしても10分待たれさるのでGearmanだと今来た仕事のためにsleepして待つわけにはいきません。 結果としてGearmanだとやってきた仕事を今すぐやるか、絶対やらないか、の二択になってしまいます。 それだと困るので、もう一方のTheSchwartzだと、今やりたくないけどあとでやる、
voxからtumblrへの引っ越し依頼を受けた。 voxはyoutubeとかswfを入れるときにiframeで囲んでページに入れている(cookieとられないように)。 フィードにもiframeがそのまま入っていてそこをどうしようか困った。けっきょくなにもしてない。 window.doc = window.doc || null; {with( new XMLHttpRequest() ) { open("GET", "http://ku0522.vox.com/library/posts/page/1/atom-full.xml", false); send(null) doc = createHTMLDocumentByString(responseText); } } function createHTMLDocumentByString(str) { var html = str.
Windows2000の時代からずーーーーーっとほしかったものがついに出たのに誰も書いてくれないので自分で書く。 前からGoogleの検索履歴があとから検索できる Google Search History はあったけど、こんどの “Google Web History” はFirefoxの Google Toolbar と連携してみたページ全部の履歴をとっておいてくれて、さらにその履歴の中からだけ検索という芸当ができる。もちろん、ページの中のテキストも検索の対象に含まれます。 ということはつまり、Googleの検索で”自分の見たページだけから検索”ができるということ。あのページどっかで見たんだけど思い出せない、検索してもたくさん出てきてわからない、みたいなのは全部解決。del.icio.usにブックマークしたけど、サーバ重いし検索うまくできてるのかいまいちわかんないみたいなのも Goo
たとえばFriendFeedで、だれか(以下木村さん)がFriendFeedにアカウントないから、誰か(以下黒田さん)が勝手につくっていろいろ入れてたとする。 で、木村さんがある時点でFriendFeedやりたくなって、黒田さんが勝手に作ってた木村さんのアカウントを自分のものにしたくなったとしたときに、できるような仕組みがあると、いいとおもう。 tako3みたいなの、本人(正確にはそこでリストされているURLのコンテンツを書き換えられる権限を持った人)だったら編集できるとか。google sitemaps みたいに、特定の何かをページに書かせて認証する。 twitterで、文章解析して、その人が何を食べたかをずっとトラックするようなやつがあったとして、勝手にログとっててくれるんだけど、木村さんがそのサービスを知って、たとえば欠けてた日のデータを自分で埋めたくなったりしたときに、木村さん認証
リリース、障害情報などのサービスのお知らせ
最新の人気エントリーの配信
処理を実行中です
j次のブックマーク
k前のブックマーク
lあとで読む
eコメント一覧を開く
oページを開く