Python爬蟲怎么提取免費IP-精靈代理

<th id="bb20k"></th>

<th id="bb20k"></th>

<progress id="bb20k"></progress>

您的位置：新聞資訊 >文章內容

Python爬蟲怎么提取免費IP

來源：Python中文社區作者：admin 時間：2018-12-12 16:10:02

爬蟲經常會遇到IP限制，如果不使用IP進行切換，是沒有辦法繼續采集的。這主要是網站針對爬蟲的措施，那么如何能夠突破IP限制呢？最簡單快捷的方法就是使用IP池，頻繁切換IP訪問，這肯定是需要大量的IP，這IP怎么來？可以使用Python爬蟲抓取免費IP，下面一起去看看Python爬蟲怎么提取免費IP。

一、requests代理使用

對于requests來說，代理的設置比較簡單，只需要傳入proxies參數即可。

不過需要注意的是，這里我是在本機安裝了抓包工具Fiddler，并用它在本地端口8888創建了一個HTTP代理服務（用Chrome插件SwitchyOmega），即代理服務為：127.0.0.1:8888，我們只要設置好這個代理，就可以成功將本機ip切換成代理軟件連接的服務器ip了。

import requests

proxy = '127.0.0.1:8888'proxies = {
    'http':'http://' + proxy,
    'https':'http://' + proxy}try:
    response = requests.get('http://httpbin.org/get',proxies=proxies)
    print(response.text)except requests.exceptions.ConnectionError as e:
    print('Error',e.args)

這里我是用來http://httpbin.org/get作為測試網站，我們訪問該網頁可以得到請求的有關信息，其中origin字段就是客戶端ip，我們可以根據返回的結果判斷代理是否成功。返回結果如下：

{
    "args":{}，    "headers":{
        "Accept":"*/*",
        "Accept-Encoding":"gzip, deflate",
        "Connection":"close",
        "Host":"httpbin.org",
        "User-Agent":"python-requests/2.18.4"
    },
    "origin":"xx.xxx.xxx.xxx",
    "url":"http://httpbin.org/get"}

二、爬取代理網頁ip和端口

開始爬取代理IP，首先我們打開Chrome瀏覽器查看網頁，并找到ip和端口元素的信息。

Python爬蟲怎么提取免費IP

可以看到，代理IP以表格存儲ip地址及其相關信息，所以我們用BeautifulSoup提取時很方便便能提取出相關信息，但是我們需要注意的是，爬取的ip很有可能出現重復的現象，尤其是我們同時爬取多個代理網頁又存儲到同一數組中時，所以我們可以使用集合來去除重復的ip。

Python爬蟲怎么提取免費IP

將要爬取頁數的ip爬取好后存入數組，然后再對其中的ip逐一測試。

三、檢測爬取到的ip是否可用

Python爬蟲怎么提取免費IP

這里就用到了上面提到的requests設置代理的方法，我們使用http://httpbin.org/ip作為測試網站，它可以直接返回我們的ip地址，測試通過后再存入MomgoDB數據庫。

四、將爬取的可用代理存入MongoDB

連接數據庫然后指定數據庫和集合，再將數據插入就OK了。

最后運行查看一下結果吧

畢竟是免費代理，有效的還是很少的，并且存活時間確實很短，不過，爬取的量大，還是能找到可用的，我們只是用作練習的話，還是勉強夠用的?，F在看看數據庫里存儲的吧。

五、隨機抽取一個ip,測試成功后返回

因為爬取的頁數不多，加上有效ip也少，再加上我沒怎么爬，所以現在數據庫里的ip并不多，不過也算是將這些ip給存了下來?，F在就來看看怎么隨機取出來吧。

由于擔心放入數據庫一段時間后ip會失效，所以取出前我重新進行了一次測試，如果成功再返回ip，不成功的話就直接將其移出數據庫。

這樣我們需要使用代理的時候，就能通過數據庫隨時取出來了。

相關資訊

1、免費代理IP有用嗎 2、做爬蟲為什么不推薦使用免費代理ip 3、怎么建免費爬蟲代理ip池？使用代理IP池效果怎樣 4、為什么免費的代理IP不好用？自己搭建代理IP池要注意什么 5、http代理選哪家比較好？免費在線代理網站 6、使用免費代理IP安全嗎？代理IP用哪種好？

相關文章內容簡介

國內住宅IP代理使用指南

精靈代理-專業提供國內動態ip代理 ip加速器 http代理網絡加速器服務，企業級代理IP服務 API支持自建代理服務器安全穩定高效。國內住宅IP代理使用指南隨著互聯網的發展和普及，許多人在日常生活和工作中都需要使用代理工具來訪問特定網站或保護個人隱私。而在選擇代理時，國內住宅IP代理成為了越來越多人的首選。本文將為大家介紹國內住宅IP代理的使用指南，幫助大家更好地利用這一工具。一、了解國內住宅IP代理的特點國內住宅IP代理是指利用在國內的住宅網絡環境下獲取的IP地址進行代理服務。相比其他類型的代理，國內住宅IP代理具有更高的穩定性和安全性，能夠更好地模擬真實用戶的上網行為，提高訪問成功率。同時，由于IP地址是來自真實的住宅網絡環境，使用起來更加安全可靠。二、選擇合適的國內住宅IP代理服務商在選擇國內住宅IP代理服務商時，需要注意以下幾點：首先是IP地址的穩定性和可靠性，確保能夠正常訪問目標網站；其次是服務商的信譽和口碑，選擇有良好口碑和專業服務的代理提供商；最后是價格和服務質量的平衡，不要只看價格而忽視了服務質量。三、配置代理設置在使用國...[閱讀全文]

解鎖高速不限量IP代理

精靈代理-專業提供國內動態ip代理 ip加速器 http代理網絡加速器服務。解鎖高速不限量IP代理在當今互聯網時代，隨著網絡安全和隱私保護意識的提高，許多人都開始關注如何保護自己的在線活動不受跟蹤和監視。IP代理就成為了一種常用的工具，通過隱藏真實IP地址來保護個人隱私和保密性。而高速不限量IP代理更是用戶們追求的目標。高速代理的重要性對于許多用戶來說，網絡速度是使用代理時最關鍵的問題之一。如果代理速度太慢，會導致網頁加載緩慢，甚至無法正常使用某些服務。因此，高速代理變得尤為重要。高速代理可以確保用戶在使用代理時，不會受到速度的限制，能夠正常流暢地訪問各種網站和服務。不限量代理的優勢另外，不限量的代理也是用戶們所追求的。有些代理服務提供商會對用戶的流量進行限制，一旦超出限制就會導致代理服務無法正常使用。而不限量的代理則可以避免這個問題，用戶可以隨意使用代理服務，不用擔心流量限制的問題。如何解鎖高速不限量IP代理要解鎖高速不限量IP代理，首先需要選擇一個可靠的代理服務提供商。在選擇代理服務提供商時，用戶需要注意服務商的信譽度、服務質量和價格等因素...[閱讀全文]

推薦閱讀

1、干貨分享：網絡推廣實用性技巧11-12 2、爬蟲用哪家動態代理好？自建與購買代理IP的優劣勢分析11-13 3、代理服務器有什么作用？分享個好用的代理IP軟件11-15 4、怎么驗證代理IP是否可用？哪一款代理IP好用?11-19 5、Python爬蟲怎么獲取分頁數據11-27 6、三個新手學習Python爬蟲簡單案例12-04

熱門文章

1、什么是IP代理？IP代理有什么用09-20 2、代理IP地址怎么設置09-20 3、http代理和https代理的區別09-21 4、代理服務器的分類有哪些09-18 5、代理服務器是什么09-18 6、代理IP有什么用09-20 7、代理服務器的工作原理09-21 8、HTTP代理與SOCKS代理的區別09-18

隨機推薦

1、代理IP主要指是什么?11-02 2、代理服務器有哪些作用10-16 3、做網絡營銷怎么換IP？更換電腦IP地址的常用方法11-08 4、爬蟲怎么爬取大規模數據的？精靈代理千萬IP池來幫忙11-20

在線咨詢

800819103

在線客服，實時響應

qq群

在線客服，實時響應

客服電話

13318873961

微信公眾號

微信公眾號

国产欧美一区,国产一本大道香蕉AV,国产亚洲卡通另类图片,国产高清AV在线