- 依內容分級制度,未登入僅能顯示普遍級內容,登入後即可觀看全站內容。
- 馬上登入
關注
關注作者、出版社、系列,新刊上架可獲得通知!
內容簡介
網路爬蟲是AI範疇中,取得資料與儲存的一項重要技能,而Python是爬蟲過程中相當好用的工具。
全書以簡單的Python程式為主軸,讓您可以輕鬆學會如何利用Python的模組擷取公開的網站資料、網頁內容,並建立自己的自動化爬蟲程式,增進您在網路上搜刮資料的能力與效率,是已具有Python基礎的學習者最佳的爬蟲入門工具書。
【本書特色】
★了解網站、網頁、瀏覽器間的關係,認識爬蟲程式
★了解網路上格式HTML/CSV/JSON/XLSX
★使用requests模組取得網路上的資料
★擷取及解析JSON及CSV格式資料檔案
★利用Regular Expression及BeautifulSoup模組剖析網頁資料
★活用Chrome開發人員工具找出網頁中特定資料的CSS選擇器內容
★使用Selenium自動化工具擷取動態網頁
★把擷取的資料儲存到MySQL及MongoDB資料庫
★利用排程器做到自動化資料擷取及通知的功能
★透過Scrapy框架建立爬蟲程式,大量搜刮資料
【本書特色】
★了解網站、網頁、瀏覽器間的關係,認識爬蟲程式
★了解網路上格式HTML/CSV/JSON/XLSX
★使用requests模組取得網路上的資料
★擷取及解析JSON及CSV格式資料檔案
★利用Regular Expression及BeautifulSoup模組剖析網頁資料
★活用Chrome開發人員工具找出網頁中特定資料的CSS選擇器內容
★使用Selenium自動化工具擷取動態網頁
★把擷取的資料儲存到MySQL及MongoDB資料庫
★利用排程器做到自動化資料擷取及通知的功能
★透過Scrapy框架建立爬蟲程式,大量搜刮資料
作者簡介
何敏煌
國立交通大學資訊科學博士,現任職於國立高雄科技大學博雅教育中心,平時除了研究KVM虛擬雲端容錯與分散式系統相關技術之外,也利用閒暇之餘致力於推廣資訊科技、Maker自學課程、與程式設計教育。
個人網站:http://drho.club
個人網站:http://drho.club
相關推薦書刊
買此商品的人也買了...
購買前的注意事項
- 本書城的商品為電子書及電子雜誌,並非紙本書。讀者可透過電腦裝置網頁瀏覽,或使用 iPhone、iPad、Android 手機或平板電腦下載閱讀。
- 如有下載閱讀需求,為避免裝置版本無法適用,建議於購書前,先確認您的裝置可下載BOOK☆WALKER的APP,並可先下載免費電子書,確認可順利使用後再行購書。
- 由於數位智慧財產權之特性,所販售之電子書刊經購買後,除內容有瑕疵或錯誤者外,不得要求退貨及退款。如有特殊情形,請洽敝公司客服人員,我們將盡速為您處理。