永久免费久久毛片,做i爱视频在线观看

一個用于提取簡體中文字符串中省，市和區(qū)并能夠進行映射，檢驗和簡單繪圖的python模塊。

舉個例子：

["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)"]
        ↓ 轉(zhuǎn)換
|省    |市   |區(qū)    |地址                 |
|上海市|上海市|徐匯區(qū)|虹漕路461號58號樓5樓  |
|福建省|泉州市|洛江區(qū)|萬安塘西工業(yè)區(qū)        |

注：“地址”列代表去除了省市區(qū)之后的具體地址

也可以將大段文本中所有提到的地址提取出來，并且自動將相鄰的存在所屬關(guān)系的地址歸并到一條記錄中（0.5.5版本新功能）：

"分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)"
        ↓ 轉(zhuǎn)換
|省    |市   |區(qū)    |
|上海市|上海市|徐匯區(qū)|
|福建省|泉州市|洛江區(qū)|
|江蘇省|南京市|鼓樓區(qū)|

代碼目前僅僅支持python3

pip install cpca

注:cpca是chinese province city area的縮寫

如果覺得本模塊對你有用的話，施舍個star，謝謝。

常見安裝問題：

在 windows 上可能會出現(xiàn)類似如下問題

Building wheel for pyahocorasick (setup.py) ... error

先去下載 Microsoft Visual C++ Build Tools，安裝完成后，再重新使用 pip install cpca 安裝，即可解決問題

開始使用

本模塊中最主要的方法是cpca.transform，該方法可以輸入任意的可迭代類型（如list，pandas的Series類型等），然后將其轉(zhuǎn)換為一個DataFrame，下面演示一個最為簡單的使用方法：

location_str = ["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)", "北京朝陽區(qū)北苑華貿(mào)城"]
import cpca
df = cpca.transform(location_str)
df

輸出的結(jié)果為(adcode為官方地址編碼)：

   省     市    區(qū)          地址              adcode
0 上海市 上海市  徐匯區(qū)     虹漕路461號58號樓5樓  310104
1 福建省 泉州市  洛江區(qū)     萬安塘西工業(yè)區(qū)        350504
2 北京市 市轄區(qū)  朝陽區(qū)     北苑華貿(mào)城           110105

如果你想獲知程序是從字符串的那個位置提取出省市區(qū)名的，可以添加一個pos_sensitive=True參數(shù)：

location_str = ["徐匯區(qū)虹漕路461號58號樓5樓", "泉州市洛江區(qū)萬安塘西工業(yè)區(qū)", "北京朝陽區(qū)北苑華貿(mào)城"]
import cpca
df = cpca.transform(location_str, pos_sensitive=True)
df

輸出如下：

     省    市    區(qū)        地址               adcode        省_pos  市_pos 區(qū)_pos
0  上海市  上海市  徐匯區(qū)  虹漕路461號58號樓5樓   310104     -1     -1      0
1  福建省  泉州市  洛江區(qū)  萬安塘西工業(yè)區(qū)         350504     -1      0      3
2  北京市  市轄區(qū)  朝陽區(qū)  北苑華貿(mào)城            110105     -1     -1      0

從大段文本中提取多個地址（0.5.5版本新功能）：

import cpca
df = cpca.transform_text_with_addrs("分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)")
df

結(jié)果為（注意 transform_text_with_addrs 獲得的數(shù)據(jù)，“地址”列都是空的）：

    省     市     區(qū)    地址   adcode
0  上海市  市轄區(qū)  徐匯區(qū)       310104
1  福建省  泉州市  洛江區(qū)       350504
2  江蘇省  南京市  鼓樓區(qū)       320106

transform_text_with_addrs 還支持和 transform 類似的 index, pos_sensitive 以及 umap 參數(shù)

繪圖：

模塊中還自帶一些簡單繪圖工具，可以在地圖上將上面輸出的數(shù)據(jù)以熱力圖的形式畫出來.

這個工具依賴folium，為了減小本模塊的體積，所以并不會預(yù)裝這個依賴，在使用之前請使用pip install folium .

代碼如下：

import cpca
from cpca import drawer
df = cpca.transform_text_with_addrs("分店位于徐匯區(qū)虹漕路461號58號樓5樓和泉州市洛江區(qū)萬安塘西工業(yè)區(qū)以及南京鼓樓區(qū)")
drawer.draw_locations(df[cpca._ADCODE], "df.html")

繪圖展示

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

自動識別

自動識別

+關(guān)注

關(guān)注
3

文章
234

瀏覽量
23953
python

python

+關(guān)注

關(guān)注
57

文章
4876

瀏覽量
90049

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

Python pacp模塊：自動識別文字中的省市區(qū)并將其繪圖

開始使用

從大段文本中提取多個地址（0.5.5版本新功能）：

繪圖：

評論