W3Cschool
恭喜您成為首批注冊(cè)用戶(hù)
獲得88經(jīng)驗(yàn)值獎(jiǎng)勵(lì)
有時(shí)您需要檢查網(wǎng)頁(yè)的源代碼(而不是 DOM )確定所需數(shù)據(jù)的位置。
使用Scrapy's ?fetch
? 命令下載Scrapy看到的網(wǎng)頁(yè)內(nèi)容:
scrapy fetch --nolog https://example.com > response.html
如果所需數(shù)據(jù)位于 ?<script/>
? 元素,請(qǐng)參見(jiàn) 分析javascript代碼 .
如果你找不到想要的數(shù)據(jù),首先要確保它不僅僅是垃圾:用HTTP客戶(hù)端下載網(wǎng)頁(yè),比如 curl 或 wget 看看這些信息是否可以在他們得到的響應(yīng)中找到。
如果他們得到所需數(shù)據(jù)的響應(yīng),請(qǐng)修改您的 Scrapy ?Request
? 以匹配其他HTTP客戶(hù)端。例如,嘗試使用相同的用戶(hù)代理字符串 (?USER_AGENT
? )或者同樣的 ?headers
? .
如果他們也得到了沒(méi)有所需數(shù)據(jù)的響應(yīng),那么您需要采取措施使您的請(qǐng)求更類(lèi)似于Web瀏覽器的請(qǐng)求。見(jiàn) 復(fù)制請(qǐng)求 .
Copyright©2021 w3cschool編程獅|閩ICP備15016281號(hào)-3|閩公網(wǎng)安備35020302033924號(hào)
違法和不良信息舉報(bào)電話(huà):173-0602-2364|舉報(bào)郵箱:jubao@eeedong.com
掃描二維碼
下載編程獅App
編程獅公眾號(hào)
聯(lián)系方式:
更多建議: