Python爬蟲方向簡歷1_第1頁
Python爬蟲方向簡歷1_第2頁
Python爬蟲方向簡歷1_第3頁
全文預(yù)覽已結(jié)束

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報或認(rèn)領(lǐng)

文檔簡介

個人簡歷Lifeistooshort,個人簡歷Lifeistooshort,weneedPython姓姓名:xxx民族:漢 電話:郵箱:學(xué)歷:本科|英語六級年齡:26期望薪資:12000工作年限:Python開發(fā)兩年求職意向:Python工程師畢業(yè)院校:婚姻狀況:未婚基本屬性Python技能Python技能:·熟練掌握python的基本語法,對面向?qū)ο笏枷胗幸欢ǖ牧私狻ち私釶ython垃圾回收機制及其原理·對系統(tǒng)編程和網(wǎng)絡(luò)編程有一定的認(rèn)識爬蟲技能:·熟悉HTTP/HTTPS協(xié)議,TCP/IP網(wǎng)絡(luò)協(xié)議

·掌握常見的爬蟲、反爬蟲知識及應(yīng)對措施

·熟練使用Pythonlxml、BeautifulSoup、re、json模塊進(jìn)行數(shù)據(jù)提取

·熟悉XPath語法規(guī)則和各CSSSelector的使用

·了解Tesseract機器圖像識別系統(tǒng),并處理簡單的文字驗證碼

·熟練使用Selenium+PhantomJS實施動態(tài)HTML抓取

·掌握Scrapy框架,以及編寫各類中間件

·了解scrapy-redis分布式框架,了解各組件工作機制·熟悉fiddler抓包工具的使用,能夠獲取到動態(tài)生成的頁面

web技能:·掌握HTML、CSS、jQuery等前端頁面的基礎(chǔ)制作,了解Django框架數(shù)據(jù)庫技能:·熟練使用MySQL數(shù)據(jù)庫,了解MongoDB,Redis的相關(guān)操作其他技能:·熟悉Linux開發(fā)環(huán)境,熟練掌握常用命令行的使用·了解分布式管理控制系統(tǒng)Git,并掌握常用命令·了解Numpy,Pandas,matplotlib等的數(shù)據(jù)分析工具

·英語六級,具有一定的英文文檔閱讀能力和翻譯能力,能進(jìn)行日常英語交流技能清單工作經(jīng)歷201工作經(jīng)歷2015/06--2017/08西安亞森通信股份有限公司|python工程師工作描述:

該公司為外包公司,任職期間根據(jù)公司業(yè)務(wù)需要被外派到其他公司進(jìn)行項目開發(fā),主要工作包括:

1.負(fù)責(zé)電子商務(wù)網(wǎng)站后端開發(fā);

2.按照項目計劃,按時提交高質(zhì)量的代碼,完成開發(fā)任務(wù);

3.參與爬蟲系統(tǒng)的架構(gòu)設(shè)計與開發(fā),完成采集任務(wù)、多線程爬蟲。2014/08-2015/042016-08至2017-08天路網(wǎng)絡(luò)科技有限公司Python開發(fā)工程師負(fù)責(zé)公司業(yè)務(wù)系統(tǒng)的設(shè)計及改進(jìn);負(fù)責(zé)公司外派項目開發(fā)工作;負(fù)責(zé)公司部分項目后臺數(shù)據(jù)支持及系統(tǒng)維護(hù)。2014/08-2015/05西安云動力科技有限公司|前端工程師工作描述:1.負(fù)責(zé)靜態(tài)頁面的設(shè)計;2.開發(fā)技術(shù):html+css+javascript。項目經(jīng)驗項目經(jīng)驗新聞分類資訊分布式爬蟲項目簡介:

這個項目是對新浪,騰訊等網(wǎng)站分類新聞資訊爬取的分布式實現(xiàn)。責(zé)任描述:

1.采用scrapy-redis分布式框架實現(xiàn)爬蟲集群,分布式使用Redis實現(xiàn)

2.存儲Request請求和指紋集合,并且對各個Slave端爬蟲實現(xiàn)集中管理和控制

3.利用Redis的高并發(fā)和I/O讀寫來實現(xiàn)高速下載

4.采用MongoDB做為本地數(shù)據(jù)庫,將資訊新聞按所屬大類、子類以及標(biāo)題和內(nèi)容,保存在MongoDB中

5.同時每次下載前會檢查請求指紋,防止重復(fù)下載,避免資源浪費網(wǎng)易云音樂(個人項目)責(zé)任描述:

1.找到start_url;導(dǎo)入selenium的webdriver包

2.發(fā)送get請求,獲得響應(yīng)

3.利用find_elements_by_xpath來獲取數(shù)據(jù)

4.對某一首歌曲的所有評論進(jìn)行點贊豆瓣電影分類排行榜(個人項目)責(zé)任描述:1.分析網(wǎng)頁url地址,獲悉該網(wǎng)頁是動態(tài)加載生成的2.由抓包獲得需要的請求參數(shù),并進(jìn)行分析3.發(fā)送請求,并獲取到每部電影的名字、主演和評分有道翻譯/百度翻譯(個人項目)責(zé)任描述:1.分析是get請求還是post請求,獲得url2.得知是post請求時,通過抓包獲得請求參數(shù)3.發(fā)送請求并且通過用戶輸入的指令進(jìn)行翻譯萬表官網(wǎng)的爬?。▊€人項目)項目描述:通過對萬表官網(wǎng)的爬取,可以知道查到這個平臺目前各個品牌的手表的型號、參數(shù)、銷量,折扣以及價格。責(zé)任描述: 1.采用requests實現(xiàn)爬取 2.通過get獲取頁面的內(nèi)容 3.用xpath提取想要的節(jié)點

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論