xpath helper chrome插件(爬蟲網(wǎng)頁解析工具)是一款非常受開發(fā)人員歡迎的瀏覽器插件,適用于谷歌瀏覽器,這款插件能夠快速精準(zhǔn)地對xpath路徑定位、進(jìn)行獲取,為寫爬蟲、從事網(wǎng)頁分析的朋友提供極大的方便。有需要的朋友歡迎來下載使用!
一款免費(fèi)的chrome爬蟲網(wǎng)頁解析工具。可以幫助用戶解決在獲取xpath路徑時(shí)無法正常定位等問題。該插件主要能幫助你在各類網(wǎng)站上通過按shift鍵選擇想要查看的頁面元素來提取查詢其代碼,同時(shí)你還能對查詢出來的代碼進(jìn)行編輯,而編輯出的結(jié)果將立即顯示在旁邊的結(jié)果框中。
啟動(dòng)xpath helper極速版后,只需按住shift鍵并移動(dòng)鼠標(biāo)至目標(biāo)區(qū)域,即可在插件窗口中即時(shí)查看代碼查詢結(jié)果。 操作步驟如下:首先,打開新標(biāo)簽頁并訪問你心儀的網(wǎng)頁; 接著,通過快捷鍵ctrl-shift-x呼出xpath輔助控制臺; 然后,按住shift鍵在頁面上選擇元素,查詢框?qū)?shí)時(shí)更新顯示當(dāng)前元素的xpath查詢結(jié)果; 最后,如需調(diào)整查詢,可直接在控制臺編輯,結(jié)果框會(huì)立即呈現(xiàn)變更后的結(jié)果。 結(jié)束時(shí),再次按下ctrl-shift-x即可關(guān)閉控制臺。
雖然插件使用非常方便,但它也不是萬能的,有兩個(gè)問題:
1.插件自動(dòng)提取的 xpath 都是從根路徑開始的,這幾乎必然導(dǎo)致 xpath 過長,不利于維護(hù);
2.當(dāng)提取循環(huán)的列表數(shù)據(jù)時(shí),本插件是使用的下標(biāo)來分別提取的列表中的每一條數(shù)據(jù),這樣并不適合程序批量處理,還是需要人為修改一些類似于*標(biāo)記等。不過,合理的使用xpath,還是能幫我們省下很多時(shí)間的!
每一個(gè)寫爬蟲、或者是做網(wǎng)頁分析的人,相信都會(huì)因?yàn)樵诙ㄎ弧@取xpath路徑上花費(fèi)大量的時(shí)間,甚至有時(shí)候當(dāng)爬蟲框架成熟之后,基本上主要的時(shí)間都花費(fèi)在了頁面的解析上。在沒有這些輔助工具的日子里,我們只能通過搜索html源代碼,定位一些id去找到對應(yīng)的位置,非常的麻煩,而且經(jīng)常出錯(cuò)。