我們的目標是要刪除文本中的空行,可能一行也可能是多行。
所以,我的操作如下:
在此,我們匹配空行用的是
(rn)*
這樣,就可以匹配多個空行,同時用null來替代,就可以實現刪除空行。此方案是基於對r和n的使用。
以前在網上看到一種實現是:
n[s| ]*r
匹配之後,用null替代,也可以實現刪除空行,效果如下圖:
兩種方案都能實現相同的效果。
如果有其他的不同理解,請發表評論,大家共同進步。
我又做了以下測試,如下圖:
僅用了
nr
就完全實現了刪除所有的空行,因為在每一個空行的開頭和結尾都是
nr
所以,刪除了上一行之後,當前行還有一個nr,同樣能夠匹配上,所以,還要在做替代操作。這樣,就可以刪除所有的空行了。
那,如果是
rn,效果如何呢?
我又做了一下測試,效果如下圖:
這個就不是我們想要的結果.為什麼呢?
我想,我們可以這樣理解,
C:Program FilesCommon FilesRelive.dll
C:Program FilesCommon Filessvchost.exe
C:Program FilesInternet Explorermsvcrt.bak
C:Program FilesInternet Explorermsvcrt.dll
C:Program FilesInternet Explorermsvcrt.ebk
C:WINNTsystem32driversnpf.sys
C:WINNTsystem32wpcap.dll
C:WINNTsystem32Packet.dll
C:WINNTsystem32WanPacket.dll
C:Documents and SettingsUser nameLocal SettingsTempwmso.exe
C:Documents and SettingsUser nameLocal SettingsTempBCG5.tmp
這個是原始文本,其實,在我們進行文本處理的時候,我們可以這樣把空行,用
rn(回車換行,先回車,後換行)
來替換掉.文本就是:
C:Program FilesCommon FilesRelive.dllrnrnC:Program FilesCommon Filessvchost.exernrnC:Program FilesInternet Explorermsvcrt.bakrnC:Program FilesInternet Explorermsvcrt.dllrnnC:Program FilesInternet Explorermsvcrt.ebkrnrnrnrnC:WINNTsystem32driversnpf.sysrnC:WINNT
system32wpcap.dllrnC:WINNTsystem32Packet.dllrnC:WINNTsystem32WanPacket.dllrnrnC:Documents and SettingsUser nameLocal SettingsTempwmso.exernC:Documents and SettingsUser nameLocal SettingsTempBCG5.tmprnrnrn
這一段文本是一個整體,沒有回車,沒有空隙和間隔,這是我們正在處理的文本,只不過回車換行是不可見字符,所以就不能看到,但是還是存在的.
所以,在處理的時候才會出現我們上面的情況.
有此,我們可以理解為什麼
用rn匹配和替代後,
所有的rn都沒有了,所以,文本,就成為了一個連接的純字符文本了.
但是
nr
替換後,
中間的所有的nr都替代掉了,r(nr……nr)n,中間的部分都替代掉了。所以就剩最後的一個rn.