<span id="mktg5"></span>

<i id="mktg5"><meter id="mktg5"></meter></i>

        <label id="mktg5"><meter id="mktg5"></meter></label>
        最新文章專(zhuān)題視頻專(zhuān)題問(wèn)答1問(wèn)答10問(wèn)答100問(wèn)答1000問(wèn)答2000關(guān)鍵字專(zhuān)題1關(guān)鍵字專(zhuān)題50關(guān)鍵字專(zhuān)題500關(guān)鍵字專(zhuān)題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關(guān)鍵字專(zhuān)題關(guān)鍵字專(zhuān)題tag2tag3文章專(zhuān)題文章專(zhuān)題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專(zhuān)題3
        問(wèn)答文章1 問(wèn)答文章501 問(wèn)答文章1001 問(wèn)答文章1501 問(wèn)答文章2001 問(wèn)答文章2501 問(wèn)答文章3001 問(wèn)答文章3501 問(wèn)答文章4001 問(wèn)答文章4501 問(wèn)答文章5001 問(wèn)答文章5501 問(wèn)答文章6001 問(wèn)答文章6501 問(wèn)答文章7001 問(wèn)答文章7501 問(wèn)答文章8001 問(wèn)答文章8501 問(wèn)答文章9001 問(wèn)答文章9501
        當(dāng)前位置: 首頁(yè) - 科技 - 知識(shí)百科 - 正文

        Python中裝飾器的一個(gè)妙用

        來(lái)源:懂視網(wǎng) 責(zé)編:小采 時(shí)間:2020-11-27 14:40:19
        文檔

        Python中裝飾器的一個(gè)妙用

        Python中裝飾器的一個(gè)妙用:好吧,我知道是大半夜……,但我還是覺(jué)得趕緊花上半個(gè)小時(shí),把這最新的想法分享出來(lái)是值得的~直接進(jìn)入正題~ 我們來(lái)模擬一個(gè)場(chǎng)景,需要你去抓去一個(gè)頁(yè)面,然后這個(gè)頁(yè)面有好多url也要分別去抓取,而進(jìn)入這些子url后,還有數(shù)據(jù)要抓取。簡(jiǎn)單點(diǎn),我們就按照三層來(lái)
        推薦度:
        導(dǎo)讀Python中裝飾器的一個(gè)妙用:好吧,我知道是大半夜……,但我還是覺(jué)得趕緊花上半個(gè)小時(shí),把這最新的想法分享出來(lái)是值得的~直接進(jìn)入正題~ 我們來(lái)模擬一個(gè)場(chǎng)景,需要你去抓去一個(gè)頁(yè)面,然后這個(gè)頁(yè)面有好多url也要分別去抓取,而進(jìn)入這些子url后,還有數(shù)據(jù)要抓取。簡(jiǎn)單點(diǎn),我們就按照三層來(lái)

        好吧,我知道是大半夜……,但我還是覺(jué)得趕緊花上半個(gè)小時(shí),把這最新的想法分享出來(lái)是值得的~直接進(jìn)入正題~

        我們來(lái)模擬一個(gè)場(chǎng)景,需要你去抓去一個(gè)頁(yè)面,然后這個(gè)頁(yè)面有好多url也要分別去抓取,而進(jìn)入這些子url后,還有數(shù)據(jù)要抓取。簡(jiǎn)單點(diǎn),我們就按照三層來(lái)看,那我們的代碼就是如下:

        代碼如下:


        def func_top(url):
        data_dict= {}

        #在頁(yè)面上獲取到子url
        sub_urls = xxxx

        data_list = []
        for it in sub_urls:
        data_list.append(func_sub(it))

        data_dict[\'data\'] = data_list

        return data_dict

        def func_sub(url):
        data_dict= {}

        #在頁(yè)面上獲取到子url
        bottom_urls = xxxx

        data_list = []
        for it in bottom_urls:
        data_list.append(func_bottom(it))

        data_dict[\'data\'] = data_list

        return data_dict

        def func_bottom(url):
        #獲取數(shù)據(jù)
        data = xxxx
        return data

        func_top是上層頁(yè)面的處理函數(shù),func_sub是子頁(yè)面的處理函數(shù),func_bottom是最深層頁(yè)面的處理函數(shù),func_top會(huì)在取到子頁(yè)面url后遍歷調(diào)用func_sub,func_sub也是同樣。

        如果正常情況下,這樣確實(shí)已經(jīng)滿(mǎn)足需求了,但是偏偏這個(gè)你要抓取的網(wǎng)站可能極不穩(wěn)定,經(jīng)常鏈接不上,導(dǎo)致數(shù)據(jù)拿不到。

        于是這個(gè)時(shí)候你有兩個(gè)選擇:

        1.遇到錯(cuò)誤就停止,之后重新從斷掉的位置開(kāi)始重新跑
        2.遇到錯(cuò)誤繼續(xù),但是要在之后重新跑一遍,這個(gè)時(shí)候已經(jīng)有的數(shù)據(jù)不希望再去網(wǎng)站拉一次,而只去拉沒(méi)有取到的數(shù)據(jù)

        對(duì)第一種方案基本無(wú)法實(shí)現(xiàn),因?yàn)槿绻麆e人網(wǎng)站的url調(diào)整順序,那么你記錄的位置就無(wú)效了。那么只有第二種方案,說(shuō)白了,就是要把已經(jīng)拿到的數(shù)據(jù)cache下來(lái),等需要的時(shí)候,直接從cache里面取。

        OK,目標(biāo)已經(jīng)有了,怎么實(shí)現(xiàn)呢?

        如果是在C++中的,這是個(gè)很麻煩的事情,而且寫(xiě)出來(lái)的代碼必定丑陋無(wú)比,然而慶幸的是,我們用的是python,而python對(duì)函數(shù)有裝飾器。

        所以實(shí)現(xiàn)方案也就有了:

        定義一個(gè)裝飾器,如果之前取到數(shù)據(jù),就直接取cache的數(shù)據(jù);如果之前沒(méi)有取到,那么就從網(wǎng)站拉取,并且存入cache中.

        代碼如下:

        代碼如下:


        def get_dump_data(dir_name, url):
        m = hashlib.md5(url)
        filename = m.hexdigest()
        full_file_name = \'dumps/%s/%s\' % (dir_name,filename)

        if os.path.isfile(full_file_name):
        return eval(file(full_file_name,\'r\').read())
        else:
        return None


        def set_dump_data(dir_name, url, data):
        if not os.path.isdir(\'dumps/\'+dir_name):
        os.makedirs(\'dumps/\'+dir_name)

        m = hashlib.md5(url)
        filename = m.hexdigest()
        full_file_name = \'dumps/%s/%s\' % (dir_name,filename)

        f = file(full_file_name, \'w+\')
        f.write(repr(data))
        f.close()


        def deco_dump_data(func):
        def func_wrapper(url):
        data = get_dump_data(func.__name__,url)
        if data is not None:
        return data

        data = func(url)
        if data is not None:
        set_dump_data(func.__name__,url,data)
        return data

        return func_wrapper


        然后,我們只需要在每個(gè)func_top,func_sub,func_bottom都加上deco_dump_data這個(gè)裝飾器即可~~

        搞定!這樣做最大的好處在于,因?yàn)閠op,sub,bottom,每一層都會(huì)dump數(shù)據(jù),所以比如某個(gè)sub層數(shù)據(jù)dump之后,是根本不會(huì)走到他所對(duì)應(yīng)的bottom層的,減少了大量的開(kāi)銷(xiāo)!

        OK,就這樣~ 人生苦短,我用python!

        聲明:本網(wǎng)頁(yè)內(nèi)容旨在傳播知識(shí),若有侵權(quán)等問(wèn)題請(qǐng)及時(shí)與本網(wǎng)聯(lián)系,我們將在第一時(shí)間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

        文檔

        Python中裝飾器的一個(gè)妙用

        Python中裝飾器的一個(gè)妙用:好吧,我知道是大半夜……,但我還是覺(jué)得趕緊花上半個(gè)小時(shí),把這最新的想法分享出來(lái)是值得的~直接進(jìn)入正題~ 我們來(lái)模擬一個(gè)場(chǎng)景,需要你去抓去一個(gè)頁(yè)面,然后這個(gè)頁(yè)面有好多url也要分別去抓取,而進(jìn)入這些子url后,還有數(shù)據(jù)要抓取。簡(jiǎn)單點(diǎn),我們就按照三層來(lái)
        推薦度:
        標(biāo)簽: 一個(gè) python 裝飾器
        • 熱門(mén)焦點(diǎn)

        最新推薦

        猜你喜歡

        熱門(mén)推薦

        專(zhuān)題
        Top
        主站蜘蛛池模板: 国产曰批免费视频播放免费s| a级毛片在线视频免费观看| 免费无码AV片在线观看软件| 亚洲综合在线成人一区| 91福利免费视频| 亚洲国产情侣一区二区三区| 无码区日韩特区永久免费系列| 亚洲国产成人91精品| 99久久综合国产精品免费| 一本色道久久综合亚洲精品蜜桃冫 | 日韩va亚洲va欧洲va国产| 99久久免费国产特黄| 亚洲高清在线观看| 99热在线观看免费| 亚洲国产日韩女人aaaaaa毛片在线 | 亚洲av鲁丝一区二区三区| 99爱在线精品视频免费观看9| 亚洲国产精品无码久久久| 啦啦啦www免费视频| 免费无遮挡无码视频在线观看| 亚洲综合色成在线播放| 国产精品99精品久久免费| 亚洲成无码人在线观看| 永久中文字幕免费视频网站| 人禽伦免费交视频播放| 亚洲福利视频导航| 免费特级黄毛片在线成人观看| 一级一看免费完整版毛片| 久久久久亚洲av无码专区导航| 免费黄网在线观看| 成人无码视频97免费| 亚洲av产在线精品亚洲第一站| 亚洲va久久久噜噜噜久久男同| 深夜特黄a级毛片免费播放| 亚洲日韩欧洲乱码AV夜夜摸| 精品国产免费人成电影在线观看| 欧美激情综合亚洲一二区| 亚洲国产精品无码久久久蜜芽| 一二三四在线播放免费观看中文版视频| 小说专区亚洲春色校园| 久久亚洲免费视频|