一個scrapy模擬登錄的方法-精靈代理

<th id="bb20k"></th>

<th id="bb20k"></th>

<progress id="bb20k"></progress>

您的位置：新聞資訊 >文章內容

一個scrapy模擬登錄的方法

來源：互聯網作者：admin 時間：2019-01-22 17:40:26

我們在使用爬蟲進行信息的獲取時，容易遇到網站的反爬蟲機制，比如很多網站都需要先登陸，才能獲取到信息的，這該怎么辦呢？我們上哪里去找那么賬號使用？一直不斷的登陸賬戶，太麻煩了，還容易被限制住，或者出現驗證碼驗證的問題。下面我們介紹一個好用方法，即用scrapy模擬登錄。

一、快速登錄方法

我們在這里做了一個簡單的介紹，我們都知道scrapy的基本請求流程是start_request方法遍歷start_urls列表，然后make_requests_from_url方法，里面執行Request方法，請求start_urls里面的地址，但是這里我們用的不再是GET方法，而用的是POST方法，也就常說的登錄。

1、首先我們改寫start_reqeusts方法，直接GET登錄頁面的HTML信息（有些人說你不是POST登錄么，干嘛還GET，別著急，你得先GET到登錄頁面的登錄信息，才知道登錄的賬戶、密碼等怎么提交，往哪里提交）

2、start_request方法GET到數據后，用callback參數，執行拿到response后要接下來執行哪個方法，然后在login方法里面寫入登錄用戶名和密碼（還是老樣子，一定要用dict），然后只用Request子類scrapy.FormRequest這個方法提交數據，這我一個的是FormRequest.from_response方m_法。

有些人會問，這個from__response的基本使用是條用是需要傳入一個response對象作為第一個參數，這個方法會從頁面中form表單中，幫助用戶創建FormRequest對象，最最最最重要的是它會幫你把隱藏的input標簽中的信息自動跳入表達，使用這個中方法，我們直接寫用戶名和密碼即可，我們在最后面再介紹傳統方法。

3、parse_login方法是提交完表單后callback回調函數指定要執行的方法，為了驗證是否成功。這里我們直接在response中搜索Welcome Liu這個字眼就證明登錄成功。這個好理解，重點是yield from super().start_resquests()，這個代表著如果一旦登錄成功后，就直接帶著登錄成功后Cookie值，方法start_urls里面的地址。這樣的話登錄成功后的response可以直接在parse里面寫。

一個scrapy模擬登錄的方法

有的同學可能問了，login方法里面不是應該寫reture 么，其實上面的寫法跟下面的這種寫法是一樣效果，如果再有個CSRF的話，也可以直接在login里面寫拿到CSRF信息，寫入到formdata里面跟用戶名和密碼一起提交。

1 return [FormRequest.from_response(response,formdata=formdata,callback=self.parse_login)]

登錄成功

一個scrapy模擬登錄的方法

二、傳統登錄方法

1、首先要明確一件事情，一般情況下需要登錄的網站，不只需要登錄用戶和密碼，接下來我們聊聊上面說的傳統登錄模式。用戶在登錄的時候并不是只需要登錄賬戶信息，除了常見直觀的驗證碼和CSRF信息外，也有可能需要提交其它信息，我們必須把它們都提取到一起提交給服務器。

一個scrapy模擬登錄的方法

2、我們在form表單下面找到了一個display:none的div標簽，里面的input標簽的value值正好是我們要提交的數據，那我們就提取到他。

一個scrapy模擬登錄的方法

上文介紹了python爬蟲之scrapy模擬登錄，僅供參考。

相關資訊

1、一個scrapy模擬登錄的方法 2、代理服務器的分類有哪些 3、HTTP代理與SOCKS代理的區別 4、代理服務器的可以分為哪些種類 5、http代理和https代理的區別 6、代理服務器的工作原理

相關文章內容簡介

國內住宅IP代理使用指南

精靈代理-專業提供國內動態ip代理 ip加速器 http代理網絡加速器服務，企業級代理IP服務 API支持自建代理服務器安全穩定高效。國內住宅IP代理使用指南隨著互聯網的發展和普及，許多人在日常生活和工作中都需要使用代理工具來訪問特定網站或保護個人隱私。而在選擇代理時，國內住宅IP代理成為了越來越多人的首選。本文將為大家介紹國內住宅IP代理的使用指南，幫助大家更好地利用這一工具。一、了解國內住宅IP代理的特點國內住宅IP代理是指利用在國內的住宅網絡環境下獲取的IP地址進行代理服務。相比其他類型的代理，國內住宅IP代理具有更高的穩定性和安全性，能夠更好地模擬真實用戶的上網行為，提高訪問成功率。同時，由于IP地址是來自真實的住宅網絡環境，使用起來更加安全可靠。二、選擇合適的國內住宅IP代理服務商在選擇國內住宅IP代理服務商時，需要注意以下幾點：首先是IP地址的穩定性和可靠性，確保能夠正常訪問目標網站；其次是服務商的信譽和口碑，選擇有良好口碑和專業服務的代理提供商；最后是價格和服務質量的平衡，不要只看價格而忽視了服務質量。三、配置代理設置在使用國...[閱讀全文]

解鎖高速不限量IP代理

精靈代理-專業提供國內動態ip代理 ip加速器 http代理網絡加速器服務。解鎖高速不限量IP代理在當今互聯網時代，隨著網絡安全和隱私保護意識的提高，許多人都開始關注如何保護自己的在線活動不受跟蹤和監視。IP代理就成為了一種常用的工具，通過隱藏真實IP地址來保護個人隱私和保密性。而高速不限量IP代理更是用戶們追求的目標。高速代理的重要性對于許多用戶來說，網絡速度是使用代理時最關鍵的問題之一。如果代理速度太慢，會導致網頁加載緩慢，甚至無法正常使用某些服務。因此，高速代理變得尤為重要。高速代理可以確保用戶在使用代理時，不會受到速度的限制，能夠正常流暢地訪問各種網站和服務。不限量代理的優勢另外，不限量的代理也是用戶們所追求的。有些代理服務提供商會對用戶的流量進行限制，一旦超出限制就會導致代理服務無法正常使用。而不限量的代理則可以避免這個問題，用戶可以隨意使用代理服務，不用擔心流量限制的問題。如何解鎖高速不限量IP代理要解鎖高速不限量IP代理，首先需要選擇一個可靠的代理服務提供商。在選擇代理服務提供商時，用戶需要注意服務商的信譽度、服務質量和價格等因素...[閱讀全文]

推薦閱讀

1、爬蟲怎么爬取圖片？爬蟲實現批量下載圖片12-03 2、三個新手學習Python爬蟲簡單案例12-04 3、怎么快速掌握網絡爬蟲基礎，實現大量信息爬取12-07 4、自動識別字符驗證碼--識別模型、標記、特征選擇12-15 5、Python爬蟲怎么使用代理IP12-20 6、用Fiddler怎樣抓取APP的數據包的方法12-24

熱門文章

1、什么是IP代理？IP代理有什么用09-20 2、代理IP地址怎么設置09-20 3、http代理和https代理的區別09-21 4、代理服務器的分類有哪些09-18 5、代理服務器是什么09-18 6、代理IP有什么用09-20 7、代理服務器的工作原理09-21 8、HTTP代理與SOCKS代理的區別09-18

隨機推薦

1、代理格式的含義詳解09-21 2、爬蟲IP代理的IP地址與普通的IP地址有什么區別10-17 3、為什么電腦換ip軟件越來越受到電商的歡迎10-08 4、哪個爬蟲框架比較好用？八種高效爬蟲框架11-30

在線咨詢

800819103

在線客服，實時響應

qq群

在線客服，實時響應

客服電話

13318873961

微信公眾號

微信公眾號

国产欧美一区,国产一本大道香蕉AV,国产亚洲卡通另类图片,国产高清AV在线