<span id="mktg5"></span>

<i id="mktg5"><meter id="mktg5"></meter></i>

        <label id="mktg5"><meter id="mktg5"></meter></label>
        最新文章專題視頻專題問答1問答10問答100問答1000問答2000關鍵字專題1關鍵字專題50關鍵字專題500關鍵字專題1500TAG最新視頻文章推薦1 推薦3 推薦5 推薦7 推薦9 推薦11 推薦13 推薦15 推薦17 推薦19 推薦21 推薦23 推薦25 推薦27 推薦29 推薦31 推薦33 推薦35 推薦37視頻文章20視頻文章30視頻文章40視頻文章50視頻文章60 視頻文章70視頻文章80視頻文章90視頻文章100視頻文章120視頻文章140 視頻2關鍵字專題關鍵字專題tag2tag3文章專題文章專題2文章索引1文章索引2文章索引3文章索引4文章索引5123456789101112131415文章專題3
        問答文章1 問答文章501 問答文章1001 問答文章1501 問答文章2001 問答文章2501 問答文章3001 問答文章3501 問答文章4001 問答文章4501 問答文章5001 問答文章5501 問答文章6001 問答文章6501 問答文章7001 問答文章7501 問答文章8001 問答文章8501 問答文章9001 問答文章9501
        當前位置: 首頁 - 科技 - 知識百科 - 正文

        python爬蟲怎么識別

        來源:懂視網 責編:小采 時間:2020-11-27 14:09:53
        文檔

        python爬蟲怎么識別

        python爬蟲怎么識別:1、輸入式驗證碼這種驗證碼主要是通過用戶輸入圖片中的字母、數字、漢字等進行驗證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背
        推薦度:
        導讀python爬蟲怎么識別:1、輸入式驗證碼這種驗證碼主要是通過用戶輸入圖片中的字母、數字、漢字等進行驗證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背

        1、輸入式驗證碼

        這種驗證碼主要是通過用戶輸入圖片中的字母、數字、漢字等進行驗證。如下圖

        2b08202427ba636761493ee4d452b3a.png

        解決思路:這種是最簡單的一種,只要識別出里面的內容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背影影響的驗證碼如圖2,直接通過這個庫來識別就可以。但是對于有嘈雜的背景的驗證碼這種,直接識別識別率會很低,遇到這種我們就得需要先處理一下圖片,先對圖片進行灰度化,然后再進行二值化,再去識別,這樣識別率會大大提高。

        2.滑動式驗證碼

        475cc25edfb6818a2f24321e7f7f63d.png

        解決思路:對于這種驗證碼就比較復雜一點,但也是有相應的辦法。我們直接想到的就是模擬人去拖動驗證碼的行為,點擊按鈕,然后看到了缺口的位置,最后把拼圖拖到缺口位置處完成驗證。

        第一步:點擊按鈕。然后我們發現,在你沒有點擊按鈕的時候那個缺口和拼圖是沒有出現的,點擊后才出現,這為我們找到缺口的位置提供了靈感。

        第二步:拖到缺口位置。我們知道拼圖應該拖到缺口處,但是這個距離如果用數值來表示?通過我們第一步觀察到的現象,我們可以找到缺口的位置。這里我們可以比較兩張圖的像素,設置一個基準值,如果某個位置的差值超過了基準值,那我們就找到了這兩張圖片不一樣的位置,當然我們是從那塊拼圖的右側開始并且從左到右,找到第一個不一樣的位置時就結束,這是的位置應該是缺口的left,所以我們使用selenium拖到這個位置即可。這里還有個疑問就是如何能自動的保存這兩張圖?這里我們可以先找到這個標簽,然后獲取它的location和size,然后 top,bottom,left,right = location['y'] ,location['y']+size['height']+ location['x'] + size['width'] ,然后截圖,最后摳圖填入這四個位置就行。具體的使用可以查看selenium文檔,點擊按鈕前摳張圖,點擊后再摳張圖。最后拖動的時候要需要模擬人的行為,先加速然后減速。因為這種驗證碼有行為特征檢測,人是不可能做到一直勻速的,否則它就判定為是機器在拖動,這樣就無法通過驗證了。

        聲明:本網頁內容旨在傳播知識,若有侵權等問題請及時與本網聯系,我們將在第一時間刪除處理。TEL:177 7030 7066 E-MAIL:11247931@qq.com

        文檔

        python爬蟲怎么識別

        python爬蟲怎么識別:1、輸入式驗證碼這種驗證碼主要是通過用戶輸入圖片中的字母、數字、漢字等進行驗證。如下圖解決思路:這種是最簡單的一種,只要識別出里面的內容,然后填入到輸入框中即可。這種識別技術叫OCR,這里我們推薦使用Python的第三方庫,tesserocr。對于沒有什么背
        推薦度:
        • 熱門焦點

        最新推薦

        猜你喜歡

        熱門推薦

        專題
        Top
        主站蜘蛛池模板: 一级做a爰片久久毛片免费陪 | 亚洲电影日韩精品| 国产成人无码免费视频97 | 黄+色+性+人免费| 国产啪精品视频网免费| 国产91在线免费| 亚洲AV无码一区二区乱子伦 | a级毛片免费观看视频| 91福利免费视频| 日本特黄特色免费大片| 亚洲国产美女精品久久久久∴| 亚洲毛片基地4455ww| 一区二区三区免费视频播放器| 最近免费视频中文字幕大全| 久久亚洲AV成人出白浆无码国产 | 亚洲精品中文字幕无码蜜桃| 国产免费一区二区三区不卡| 最近免费中文字幕大全视频| 精品人妻系列无码人妻免费视频| 久久国产免费一区| 免费观看理论片毛片| 亚洲网站在线免费观看| 成人国产网站v片免费观看| 亚洲人成网站18禁止一区| 亚洲人成77777在线播放网站不卡| jizz免费在线观看| 国产精品美女自在线观看免费| mm1313亚洲国产精品无码试看| 免费观看男人吊女人视频| 亚洲线精品一区二区三区影音先锋 | 猫咪社区免费资源在线观看| 亚洲av午夜福利精品一区| 1a级毛片免费观看| 久久久久亚洲精品无码蜜桃| 全免费毛片在线播放| 亚洲最新黄色网址| 97国产在线公开免费观看| 亚洲AV无码无限在线观看不卡| 亚洲高清视频一视频二视频三| 久久久久久一品道精品免费看| 亚洲国产精品VA在线观看麻豆 |