[B! 正規表現] TaROのブックマーク

クローラを作る技術と設計 (毎週のハンズオン勉強会資料)

3. XPathXML や HTML の任意の位置を取得するための式XPathエンジンがあれば、 XPathを指定して HTML 上の値を簡単に持ってこれる 4. XPath<?php$url = 'http://www.nicovideo.jp/';libxml_use_internal_errors(true);$doc = new DOMDocument();$doc->loadHTML(file_get_contents($url));libxml_clear_errors();$xpath = new DOMXPath($doc);foreach ($xpath->query('//a') as $node) { echo $node->textContent . "";}

TaRO 2011/09/03

リンク

文字列から特定の文字を抽出する - Linux シェルスクリプトプログラミング

Linux シェル (sh) で、文字列から任意の文字を取り出す方法としては、外部コマンド sed を利用する方法があります。方法としては、sed コマンドの -e オプションを使って正規表現を使用して、必要な文字列に置き換えるという方法をとります。sed に渡す文字列は echo コマンドを使って渡します。 DATA1="IP Address: 192.168.0.1/255.255.255.0 RETVAL=`echo "$DATA1" | sed -e "s/^IP Address:[ \t]\+$[0-9\.]\+$\/[0-9\.]\+$/\1/g"` このようにすることで、DATA1 から "192.168.0.1" の部分を切り取って RETVAL 変数に取得することが可能になります。他にもたとえば、次のような抽出が、sed を使ってできると思います。

TaRO 2011/08/10

正規表現

リンク

正規表現で楽々コード置換 - give IT a try

会社で紹介した正規表現の入門的なテクニックをこっちにも載せておきます。まずは例題からちょっと訳あって、これまで型付けDataTableを使って書いていたロジックを、型無しのプレーンなDataTableに書き換える必要が出てきました。イメージ的にはこんな感じです(もちろん説明のためにかなり簡略化しています)。 // 変更前 BookShopDataSet.BookTable table = FindBooks(); BookShopDataSet.BookTableRow row = table[0]; Assert.AreEqual("詳説正規表現", row.Title); Assert.AreEqual("ジェフリ− E．F．フリ−ドル", row.Author); Assert.AreEqual("オライリージャパン", row.Publisher); // 他にもたくさんの

TaRO 2011/08/06

リンク

電話番号、郵便番号にマッチする真の正規表現 : にぽたん研究所

Shibuya.pm #16 「夏の正規表現祭り」で、正規表現のお話をさせていただきました。まぁ、「電話番号にマッチする正規表現」とか「郵便番号にマッチする正規表現」とかよく書かれてるけど、「どれもこれも手緩いよね」って話。あ、だいぶはしょったかな。とりあえずスライドに書いたので、発表をご覧になってない方はスライドからご覧ください。ふと見返すと、このブログで電話番号の正規表現を公表するのは 3 度目ですが、あれからだいぶ経ってますね。今ではもっと厳密な正規表現を作っています。そして、Number::Phone::JP に続き、Number::ZipCode::JP という酔狂なモジュールが公開された記念で、郵便番号にマッチする正規表現を今回初めて公開しますが、そもそもここまで厳密な正規表現が公開されること自体、本邦初公開ってヤツでしょう。 Shibuya.pm でも言いましたが

TaRO 2011/07/17

リンク

正規表現の限界 @ Shibuya.pm

swatmac.info Buy this domain. 2020 Copyright. All Rights Reserved. The Sponsored Listings displayed above are served automatically by a third party. Neither the service provider nor the domain owner maintain any relationship with the advertisers. In case of trademark issues please contact the domain owner directly (contact information can be found in whois). Privacy Policy

TaRO 2011/07/07

リンク

正規表現の解説　上級編

一般的な正規表現を使ったツールでは中級編までの内容がそのまま使えると思います。たとえばSedやAWKならば問題なく使えます。ここではPerl等のかなり強力なツールでしか使えないような表現を説明します。もちろん、K2Editorでも使える表現です。以前出てきた繰り返し表現では、繰り返し回数を指定する事はできませんでした。たとえば、aの３回繰り返しを検索したい場合、「a+」では３回繰り返し以外でもマッチしてしまいます。ですから、「aaa」としなければなりません。拡張された表現では繰り返し回数を指定できます。基本的な書式は「{n,m}」です。 nが最小回数、mが最大回数です。最大と最小が同じ場合、つまり固定回数の時には「{n}」と書きます。 aの３回繰り返しは「a{3}」と書けます。２回以上５回以下の繰り返しは「{2,5}」と書けます。５回以上の繰り返しは「{5,

TaRO 2011/06/14

リンク

正規表現の先読みについて解説してみる - http://rubikitch.com/に移転しました

先読み正規表現について、この前やっと理解できた。Rubyリファレンスマニュアルではこんな説明になっている。 (?= ) 先読み(lookahead)。パターンによる位置指定(幅を持たない) (?=re1)re2 という表現は、re1 と re2 両方にマッチするものにマッチする正規表現です。 re1(?=re2) という表現は、後に re2 とマッチする文字列が続く、正規表現 re1 です。 p /foo(?=bar)/ =~ "foobar" # => 0 p $& # => "foo" (bar の部分の情報はない) (?! ) 否定先読み(negative lookahead)。パターンの否定による位置指定(幅を持たない) (?!re1)re2 という表現は、re1 にマッチしないが re2 にはマッチする正規表現です。 # 000 を除く 3 桁の数字 re = /(?!000)\

TaRO 2011/04/20

リンク

サービス終了のお知らせ

サービス終了のお知らせいつもYahoo! JAPANのサービスをご利用いただき誠にありがとうございます。お客様がアクセスされたサービスは本日までにサービスを終了いたしました。今後ともYahoo! JAPANのサービスをご愛顧くださいますよう、よろしくお願いいたします。

TaRO 2010/11/08

リンク

正規表現で素数判定 - NO!と言えるようになりたい

追記：ハッキリ言ってこの正規表現はネタなので，実際に素数判定を行いたい場合は，もっと別な賢いアルゴリズムを使ったほうが良いです正規表現で素数が判定できるという記事を見たので試してみた． http://www.noulakaz.net/weblog/2007/03/18/a-regular-expression-to-check-for-prime-numbers/ この記事によると /^1?$|^(11+?)\1+$/ という正規表現を使うと，素数判定が出来るらしい．ある整数 n が素数かどうか判定したい場合は，"1" * nという文字列がこの正規表現にマッチするかどうかを調べればよく，マッチすれば非素数，マッチしなければ素数となる．ただし，"1" * n は，例えば，n が 4 ならば "1111" と 1 が 4 回連続して続く文字列となる． Rubyで書いた素数判定プログラムはこん

TaRO 2010/07/23

正規表現

リンク

はてなブックマーク

タグ

関連タグで絞り込む (9)

正規表現に関するTaROのブックマーク (9)

お知らせ

月間はてなブックマーク数ランキング（2024年12月）

今週のはてなブックマーク数ランキング（2025年1月第1週）

今週のはてなブックマーク数ランキング（2024年12月第4週）

公式Twitter

キーボードショートカット一覧

はてなブックマーク

公式Twitter

はてなのサービス