chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

用Python爬去百度貼吧圖片并保存到本地

馬哥Linux運維 ? 來源:lq ? 2018-12-03 14:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

描述:用Python爬去百度貼吧圖片并保存到本地。本人剛學(xué)爬蟲還不是很熟練,其中難點在于正則表達式的理解;

說明

01

獲取整個頁面數(shù)據(jù)

Urllib 模塊提供了讀取web頁面數(shù)據(jù)的接口,我們可以像讀取本地文件一樣讀取www和ftp上的數(shù)據(jù)。首先,我們定義了一個getHtml()函數(shù):

urllib.urlopen()方法用于打開一個URL地址。

read()方法用于讀取URL上的數(shù)據(jù),向getHtml()函數(shù)傳遞一個網(wǎng)址,并把整個頁面下載下來。執(zhí)行程序就會把整個網(wǎng)頁打印輸出。

02

篩選頁面中想要的數(shù)據(jù)

Python 提供了非常強大的正則表達式,我們需要先要了解一點python 正則表達式的知識才行。假如我們百度貼吧找到了幾張漂亮的壁紙,通過到前段查看工具。找到了圖片的地址,如:src=”http://imgsrc.baidu.com/forum……jpg”pic_ext=”jpeg”

我們又創(chuàng)建了getImg()函數(shù),用于在獲取的整個頁面中篩選需要的圖片連接。re模塊主要包含了正則表達式:

re.compile() 可以把正則表達式編譯成一個正則表達式對象.

re.findall() 方法讀取html 中包含 imgre(正則表達式)的數(shù)據(jù)。

運行腳本將得到整個頁面中包含圖片的URL地址。

03

將頁面篩選的數(shù)據(jù)保存到本地

通過一個for循環(huán)對獲取的圖片連接進行遍歷,為了使圖片的文件名看上去更規(guī)范,對其進行重命名,命名規(guī)則通過x變量加1。保存的位置默認為程序的存放目錄。

程序運行完成,將在目錄下看到下載到本地的文件。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • python
    +關(guān)注

    關(guān)注

    57

    文章

    4856

    瀏覽量

    89519
  • 爬蟲
    +關(guān)注

    關(guān)注

    0

    文章

    87

    瀏覽量

    7929

原文標題:Python爬取百度貼吧圖片

文章出處:【微信號:magedu-Linux,微信公眾號:馬哥Linux運維】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    怎樣Labview將AVI視頻轉(zhuǎn)換成圖片序列保存到指定文件夾

    怎么樣Labview 將一段AVI視頻轉(zhuǎn)換成圖片序列保存到指定文件夾。
    發(fā)表于 11-05 17:45

    python實現(xiàn)網(wǎng)頁爬蟲圖片

    非常強大的正則表達式,我們需要先要了解一點python 正則表達式的知識才行。re模塊中一些重要的函數(shù):假如我們百度找到了幾張漂亮的壁紙,通過到前段查看工具。找到了
    發(fā)表于 04-05 15:32

    百度競價排名這件事你怎么看?

    `魏則西事件炸出了百度競價排名的黑幕但事實上百度競價排名并不是什么新鮮玩意相信很多喜歡百度一下的親們都知道很多情況下搜索排名的前幾條都不是你想要的答案小編曾經(jīng)年少無知的時候也曾錯信過
    發(fā)表于 05-03 15:24

    Python助力百度無人車 人工智能時代到來

    今年7月份,在“百度AI開發(fā)者大會”上,百度CEO李彥宏親自乘坐百度無人車,在真實路況下演示了百度無人駕駛技術(shù),預(yù)示著人工智能時代的到來。百度
    發(fā)表于 12-13 14:48

    使用Python爬蟲實現(xiàn)百度圖片自動下載的方法

    如何用Python爬蟲實現(xiàn)百度圖片自動下載?
    發(fā)表于 05-23 14:55

    百度API調(diào)用(三)——語音識別 精選資料推薦

    需要的服務(wù),簡單填寫應(yīng)用描述即可創(chuàng)建6、創(chuàng)建完成后可以在應(yīng)用列表中管理或者刪除你所創(chuàng)建的應(yīng)用7、需要開啟對應(yīng)服務(wù)才可以使用點擊立即領(lǐng)取即可獲得免費調(diào)用次數(shù)(十幾萬次對于個人學(xué)習(xí)使用足夠了) 二、python實現(xiàn)百度語音識別實例:(發(fā)送已經(jīng)
    發(fā)表于 08-18 06:44

    怎么開通百度語音技術(shù)接口服務(wù)?

    怎么開通百度語音技術(shù)接口服務(wù)?python實現(xiàn)百度語音識別的步驟是怎樣的?
    發(fā)表于 11-22 07:18

    百度推出兩大社區(qū)商城 試水虛擬道具交易

    百度推出兩大社區(qū)商城 試水虛擬道具交易 百度昨日下午對外宣布,正式推出“商城”服務(wù),這也是百度繼“知道商城”之后推出的第二大道具
    發(fā)表于 04-01 09:46 ?765次閱讀

    百度宣布“百度AI加速器”開營,選擇免費開放AI相關(guān)技能

    今年的百度專注于AI研發(fā),據(jù)報道,百度已經(jīng)宣布“百度AI加速器”開營,選擇免費開放,讓開發(fā)者摸索AI的落地模式。據(jù)悉,目前在語音技術(shù)上跟
    發(fā)表于 12-10 10:55 ?1431次閱讀

    Python就是強大直接無視百度文庫VIP,付費文檔免費下載!

    最近要用到百度文庫查資料,但是很多都需要付費VIP或者下載券,還不能復(fù)制,就有點苦逼!還好小編會Python,在Python面前真的所有VIP都是小意思,啥視頻網(wǎng)站,資料網(wǎng)站等等,統(tǒng)統(tǒng)無視收費機
    發(fā)表于 10-28 20:55 ?8561次閱讀

    百度回應(yīng)身份證事件:高壓打擊相關(guān)違法行為

    速途網(wǎng)11月28日消息(報道:李楠) 今日,針對有媒體報道稱不法分子在百度發(fā)布收售身份證的違法信息,百度
    發(fā)表于 11-30 12:41 ?627次閱讀

    Python將二維數(shù)組輸出為圖片

    使用Python讀取二維數(shù)組,將二維數(shù)組輸出為圖片,保存本地。
    的頭像 發(fā)表于 01-11 16:18 ?2018次閱讀
    <b class='flag-5'>Python</b>將二維數(shù)組輸出為<b class='flag-5'>圖片</b>

    Python圖片輸出為二維數(shù)組保存到txt中

    使用Python圖片輸出為二維數(shù)組,保存到txt文件中。
    的頭像 發(fā)表于 01-11 16:21 ?2158次閱讀

    百度搜索重磅推出AI圖片助手

    近日,百度搜索全新上線了一款名為“百度AI圖片助手”的智能工具,該工具賦予了用戶一鍵處理圖片的強大能力。無論是搜索中的圖片還是用戶自主上傳的
    的頭像 發(fā)表于 05-06 10:20 ?3189次閱讀

    HarmonyOS實戰(zhàn):一招搞定保存圖片到相冊

    保存圖片功能幾乎是每個應(yīng)用程序必備的功能之一,當(dāng)用戶遇到喜歡的圖片時可以保存到手機相冊。那么在鴻蒙中保存
    的頭像 發(fā)表于 06-24 17:04 ?963次閱讀