




下載本文檔
版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
第python爬蟲urllib中的異常模塊處理目錄urllib中的異常處理url的組成部分URLErrorHTTPError簡介Urllib.error模塊異常處理
urllib中的異常處理
在我們寫爬蟲程序時,若出現url中的錯誤,那么我們就無法爬取我們想要的內容,對此,我們引入了urllib中的異常處理。
url的組成部分
URL由6個部分組成:eg:
/swd=易烊千璽
協議(http/https)主機()端口號(80/443)路徑(s)參數(wd=易烊千璽)錨點
常見的端口號:
http(80)https(443)mysql(3306)oracle(1521)redis(6379)mongodb(27017)
URLError
通常來說,URLError報錯通常為url地址中主機部分的錯誤:
實例:
url='1/'
運行結果:
urllib.error.URLError:urlopenerror[Errno11001]getaddrinfofailed
HTTPError
這個異常的通常是url地址中參數或是路徑的錯誤。
實例:
url='/p/3388cf148dba1'
運行結果:
urllib.error.HTTPError:HTTPError404:NotFound
簡介
HTTPError類是URLError類的子類導入的包urllib.error.HTTPError/urllib.error.URLErrorhttp錯誤:http錯誤是針對瀏覽器無法連接到服務器而增加的出來的錯誤提示,引導并告訴瀏覽者該頁是出了什么問題。通過urllib發送請求的時候,有可能會發送失敗,這個時候如果想讓你的代碼更健壯,可以通過try-except進行捕獲異常。
Urllib.error模塊
urllib.error模塊為urllib.request所引發的異常定義了異常類,基礎異常類是URLError。
urllib.error包含了兩個方法,URLError和HTTPError。
URLError是OSError的一個子類,用于處理程序在遇到問題時會引發此異常(或其派生的異常)。
HTTPError是URLError的一個子類,用于處理特殊HTTP錯誤例如作為認證請求的時候,包含的屬性code為HTTP的狀態碼,reason為引發異常的原因,headers為導致HTTPError的特定HTTP請求的HTTP響應頭。
異常處理
用tryexcept語句塊捕獲并處理異常,其基本語法結構如下所示:
try:可能產生異常的代碼塊
except[(Error1,Error2,)[ase]]:處理異常的代碼塊1
except[(Error3,Error4,)[ase]]:處理異常的代碼塊2
except[Exception]:處理其它異常
實例:
原url=/p/3388cf148dba
源碼:
importurllib.request
importurllib.error
url='1/p/3388cf148dba'
#url的組成eg:/swd=易烊千璽
#1.協議(http/https)2.主機()3.端口號(80/443)4.路徑(s)5.參數(wd=易烊千璽)6.錨點
#常見的端口號
#http(80)https(443)mysql(3306)oracle(1521)redis(6379)mongodb(27017)
headers={
'User-Agent':'Mozilla/5.0(WindowsNT10.0;Win64;x64)AppleWebKit/537.36(KHTML,likeGecko)Chrome/98.0.4758.102Safari/537.36'
request=urllib.request.Request(url=url,headers=headers)
response=urllib.request.urlopen(request)
content=response.read().decode('utf8')
print(content)
excepturllib.error.HTTPError:
print('HTTP異常,請稍后!')
excepturllib.error.URLError:
print('URL異常,請稍后!')
1.URLError
url=1/p/3388cf148dba
運行結果:
2.HTTPError
url=/p/3388cf148dba111
運行結果:
由于HTTPRError
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 神經病考試模擬題+答案
- 資金管理與運作作業指導書
- 信息技術支持下的農業電商平臺協議
- 銷售提成與售后服務合同書
- 興業銀行招聘面試常見試題及回答
- 浙江國企招聘2025浙江省鹽業集團有限公司招聘22人筆試參考題庫附帶答案詳解
- 2025年春季黑龍江大慶油田有限責任公司高校畢業生招聘50人筆試參考題庫附帶答案詳解
- 2025年合肥市產業投資控股(集團)有限公司校園招聘31人筆試參考題庫附帶答案詳解
- 2025內蒙古能源集團智慧運維公司校園招聘(55人)筆試參考題庫附帶答案詳解
- 計量試題庫及答案大全
- 2025年全國保密教育線上培訓考試試題庫及答案【網校專用】含答案詳解
- 華為管理面試題及答案
- 2024-2025學年統編版小學道德與法治三年級下冊期中考試測試卷附答案
- 智能垃圾桶設計方案資料
- 2025陜西漢中漢源電力(集團)限公司招聘56人易考易錯模擬試題(共500題)試卷后附參考答案
- 2025年北京市西城區中考一模道德與法治試卷(含答案)
- 新聞報道的寫作及范例課件
- 2025-2030中國CAD-CAM牙科系統行業市場發展趨勢與前景展望戰略研究報告
- 【9數一模】2025年安徽省合肥市第四十五中學九年級中考數學一模試卷
- 年產30萬噸生物航煤項目可行性研究報告(僅供參考)
- 南京師范大學自主招生個人陳述范文與撰寫要點
評論
0/150
提交評論