分類
教學

正規表示式 – 找出以 < 開頭以 > 結尾的內容

這樣的東西,最常見的就是 HTML 標籤啦。比如說以這段文字作為例子。

<p>內文</p>

目標是希望找到 <p> 跟 </p> 。

首先想到的,是這樣的規則:

<(.*)>

不過這樣,會連兩個標籤中間的文字都算進去。正規表示式真的還是不太懂,所以就到巴哈洽特求助一下,得到了這個好很多的規則:

<([^<>]*)>

耶?這怎麼看起來像是表情符號。 XD 不過這的確可以把 <p> 跟 </p> 找到,不會把中間的文字也算進去了。

關於這個規則,還在研究它的語意中。其中 [^<>] 的部份,意思是「除了 < 或 > 以外的字元」嗎?另外剛剛又發現另外一個問題。如果 < 跟 > 中間的東西有換行的話,就不會算進去了。關於這點,正在設法改進中……

發佈留言

發佈留言必須填寫的電子郵件地址不會公開。 必填欄位標示為 *