ip如何輔助爬蟲抓取安居客二手房信息!今天,IP模擬器代理將與大家分享爬蟲如何抓取安居客的二手房信息。爬行的主要目標(biāo)是北京二手房的信息。在爬行之前,我們先對(duì)要爬行的信息做一個(gè)簡(jiǎn)單的數(shù)據(jù)分析。首先打開二手房信息頁(yè)面,右擊查看,找到我們需要的信息所在的位置,然后抓取。
代碼如下:
導(dǎo)入請(qǐng)求,時(shí)間,隨機(jī)
來(lái)自bs4導(dǎo)入美麗組
標(biāo)頭= { ' User-Agent ':' Mozilla/5.0(Windows NT 6.1;WOW64)applebwebkit/537.36(KHTML,像Gecko)Chrome/57 . 0 . 2987 . 98 Safari/537.36 ' }
對(duì)于范圍(1,30)內(nèi)的I:
URL = ' https://Beijing . anjuke . com/sale/p { }/'。格式(一)
打印(一)
#打印(網(wǎng)址)
respomse=requests.get(url,headers = headers)
Time.sleep (random.randint (0,5)) #防止反爬。
#print(respomse.text)
soup =美化組(respomse.text,' lxml ')
house_list = soup.find_all('li ',class_="list-item ")
對(duì)于房屋列表中的房屋:
title=house.find('div ',class _ = ' house-title '). a . text . strip()
price=house.find('span ',class_='price-det').text.strip()
#皮帶增加。
打印('標(biāo)題:+標(biāo)題+'價(jià)格:+價(jià)格)
通過(guò)以上代碼,我們可以獲得北京安居客的二手房信息,IP模擬器代理為您提供安全、穩(wěn)定、高效、便捷的爬蟲代理IP服務(wù)。更多問(wèn)題請(qǐng)點(diǎn)擊官網(wǎng)咨詢客服。