@xpath

貢獻者2

粉絲0

貢獻者

@huli_5f06b98ab5a44

昵稱 happlyfox (2)

@rui0908

昵稱瑞0908 (1)

@xpath

動態列表

11:10 下午 · 11月 05 ,2025 @rui0908

xpath匹配一個標籤下所有內容

from lxml import etree import requests url = 'http://www.shihuo.cn/youhui/474770.html#qk=youhui_list' response = requests.get(url) text = etree.HTML(response.text) tt = text.xpath("//div[@class='art

lxml , python , xpath , requirejs

@rui0908

昵稱瑞0908

03:17 上午 · 10月 27 ,2025 @huli_5f06b98ab5a44

手把手教你爬取優酷電影信息 -1

爬蟲的製作主要分為三個方面 1、加載網頁結構 2、解析網頁結構，轉變為符合需求的數據實體 3、保存數據實體（數據庫，文本等）在實際的編碼過程中，找到了一個好的類庫“HtmlAgilityPack”。介紹：官網：http://html-agility-pack.net/... Html Agility Pack源碼中的類大概有28個左右，其實不算一個很複雜的

c# , 網頁爬蟲 , xpath

@huli_5f06b98ab5a44

昵稱 happlyfox

03:16 上午 · 10月 27 ,2025 @huli_5f06b98ab5a44

手把手教你爬取優酷電影信息-2

上一章節中我們實現了對優酷單頁面的爬取，簡單進行回顧一下，使用HtmlAgilityPack庫，對爬蟲的爬取一共分為三步爬蟲步驟加載頁面解析數據保存數據繼第一篇文檔後的爬蟲進階，本文章主要是對上一篇的進階。實現的功能主要為： 1、爬取電影類別列表 2、循環每個類別的電影信息，對每個類別的信息分頁爬取 3、爬取的數據保存到數據

c# , 多線程 , xpath , 網頁爬蟲

@huli_5f06b98ab5a44

昵稱 happlyfox