Skip to content

Files

Latest commit

Dec 22, 2016
8b5c5f9 · Dec 22, 2016

History

History

NewsSpider

Folders and files

NameName
Last commit message
Last commit date

parent directory

..
Dec 22, 2016
Dec 22, 2016
Dec 22, 2016

网络爬虫之最基本的爬虫:爬取网易新闻排行榜

一些说明:

  • 使用urllib2或requests包来爬取页面。

  • 使用正则表达式分析一级页面,使用Xpath来分析二级页面。

  • 将得到的标题和链接,保存为本地文件。