若你使用過(guò) Shell 中的 awk 工具,會(huì)發(fā)現(xiàn)用它來(lái)分割字符串是非常方便的。特別是多個(gè)連續(xù)空格會(huì)被當(dāng)做一個(gè)處理。
[root@localhost ~]# cat demo.txt
hello world
[root@localhost ~]#
[root@localhost ~]# awk '{print$1,$2}' demo.txt
hello world
可是轉(zhuǎn)換到 Python 上面來(lái)呢?結(jié)果可能是這樣的。
>> > msg='hello world'
>> > msg.split(' ')
['hello', '', '', '', 'world']
與我預(yù)想的結(jié)果不符,多個(gè)空格會(huì)被分割多次。
那有什么辦法可以達(dá)到 awk 一樣的效果呢?
有兩種方法。
第一種方法
不加參數(shù),這種只適用于將多個(gè)空格當(dāng)成一個(gè)空格處理,如果不是以空格為分隔符的場(chǎng)景,這種就不適用了。
>> > msg='hello world'
>> > msg.split()
['hello', 'world']
第二種方法
使用 filter 來(lái)輔助,這種適用于所有的分隔符,下面以 -
為分隔符來(lái)舉例。
>> > msg='hello----world'
>> > msg.split('-')
['hello', '', '', '', 'world']
> >>
>> > filter(None, msg.split('-'))
['hello', 'world']
是不是很神奇,filter 印象中第一個(gè)參數(shù)接收的是 函數(shù),這里直接傳 None 居然有奇效。
查看了注釋?zhuān)瓉?lái)是這個(gè)函數(shù)會(huì)適配 None 的情況,當(dāng)?shù)谝粋€(gè)參數(shù)是None的時(shí)候,返回第二個(gè)參數(shù)(可迭代對(duì)象)中非空的值,非常方便。
換用函數(shù)的寫(xiě)法,可以這樣
>> > msg='hello----world'
>> > msg.split('-')
['hello', '', '', '', 'world']
> >>
>> > filter(lambda item: True if item else False, msg.split('-'))
['hello', 'world']
-
參數(shù)
+關(guān)注
關(guān)注
11文章
1867瀏覽量
33100 -
字符串
+關(guān)注
關(guān)注
1文章
590瀏覽量
22294 -
Shell
+關(guān)注
關(guān)注
1文章
372瀏覽量
24221
發(fā)布評(píng)論請(qǐng)先 登錄
如何在bash中分割字符串
串口讀取的字符串和字符串輸入控件輸入的字符串的差別
從串口讀取的字符串與輸入的字符串使用上效果不一樣?。?/a>
字符串至字符串數(shù)組實(shí)現(xiàn)對(duì)漢字的分割
字符串的表示

新手必知的Python:分割字符串的步驟及源代碼

什么是復(fù)制字符串?Python如何復(fù)制字符串
strtok拆分字符串

評(píng)論