タグ

cpanとHTMLに関するhedachiのブックマーク (2)

  • PerlのEncodeの話 - Using Perl

    もともとはUsing MT ( MT = MovableType ) というブログ名でしたが、MTに関することをめっきりかかなくなってしまったので、Using Perlに変更しました。Perl 愛してます。 MovableType使ってます。4ですが。5への移行は諦めています。最近はMTネタよりも、Web系のプログラム関連のネタ全般にシフトしています。 いつもEncodeのあたりでつまずいて、文字化けして 試行錯誤のすえになんとか動かしている状態なのだけど、 なにかわかった気がするのでメモ。 まず最初になにするかというと、 「use Encode」と書く。 次に外部からテキストを持ってくるとき、 それがどのような文字コードなのかきちんと把握する。 それを把握した上でデコードする。 デコード(decode)とは符号化されているものを"ほどく"ということ。 codeをdeするということ。 ほど

  • Perl html パーサー はじめてのHTML::Parser - ナナクサ

    HTMLをパースしてくれるHTML::Parser。検索結果で出てくるマニュアルはいまいち分かりづらかったので、自分なりの試行錯誤メモを残しておく。 HTMLを読み込んで、特定タグの要素を抜き出す。 a タグと img タグだけの簡単なHTMLを用意して、それぞれに指定されたhref属性とsrc属性を抜き出してみる。 <html> <head> <title>TEST</title> </head> <body> <a href="http://kirinji.amayan.jp/"><img src="http://kirinji.amayan.jp/kirinji_top.gif"></a> </body> </html> で、これをHTML::Parserで解析してみる。 #!/usr/bin/perl use strict; use warnings; use HTML::Pars

    Perl html パーサー はじめてのHTML::Parser - ナナクサ
  • 1