熱線電話:13121318867

登錄
首頁精彩閱讀爬蟲解析庫xpath功能很強大嗎?
爬蟲解析庫xpath功能很強大嗎?
2020-05-14
收藏
xpath,英文全稱XML Path Language,即XML路徑語言,它是一種用來確定XML文檔中某部分位置的語言,可以在 XML文檔中查找相關的信息,相對而言功能還是比較強大的。

xpath最初是一個通用的、介于XPointer與XSL間的語法模型,基于XML的樹狀結構,提供在數據結構樹中找尋節點的能力。最初用來搜尋XML文檔,同樣適用于 HTML文檔的搜索,所以在做爬蟲時完全可以使用 XPath 做相應的信息抽取。

xpath的節點通過沿著路徑或者step來選取,它最有用的途徑表達式如下圖:



xpath使用路徑表達式來選取 XML 文檔中的節點或者節點集。這些路徑表達式和我們在常規的電腦文件系統中看到的表達式非常相似。路徑表達式是從一個XML節點(當前的上下文節點)到另一個節點、或一組節點的書面步驟順序。這些步驟以“/”字符分開,每一步有三個構成成分:


軸描述(用最直接的方式接近目標節點)


節點測試(用于篩選節點位置和名稱)


節點描述(用于篩選節點的屬性和子節點特征


一般情況下,我們使用xpath簡寫后的語法。雖然完整的軸描述是一種更加貼近人類語言,利用自然語言的單詞和語法來書寫的描述方式,但是相比之下也更加啰嗦。

數據分析咨詢請掃描二維碼

若不方便掃碼,搜微信號:CDAshujufenxi

數據分析師資訊
更多

OK
客服在線
立即咨詢
日韩人妻系列无码专区视频,先锋高清无码,无码免费视欧非,国精产品一区一区三区无码
客服在線
立即咨詢