• Python爬虫入门之Cookie的使用

    Python爬虫入门之Cookie的使用

    上一节我们研究了一下爬虫的异常处理问题,那么接下来我们一起来看一下Cookie的使用。为什么要使用Cookie呢?Cookie,指某些网站为了辨别用户身份、进行session跟踪而储存在用户本地终端上的数据(通常经过加密)比如说有些网站需要登录后才能访问某个页面,在登录之前,你想抓取某个页面内容是不...

    kavinkavin 2018.05.12 2098浏览 0
  • Python爬虫入门之URLError异常处理

    Python爬虫入门之URLError异常处理

    1.URLError首先解释下URLError可能产生的原因: 网络无连接,即本机无法上网连接不到特定的服务器服务器不存在在代码中,我们需要用try-except语句来包围并捕获相应的异常。下面是一个例子:import urllib2   requset ...

    kavinkavin 2018.05.12 2808浏览 0
  • Python爬虫入门之Urllib库的高级用法

    Python爬虫入门之Urllib库的高级用法

    urllib和urllib2库是学习Python爬虫最基本的库,利用这个库我们可以得到网页的内容,并对内容用正则表达式提取分析,得到我们想要的结果。 1.设置Headers有些网站不会同意程序直接用上面的方式进行访问,如果识别有问题,那么站点根本不会响应,所以为了完全模拟浏览器的工作,我们...

    kavinkavin 2018.05.12 2037浏览 0
  • Python爬虫入门之Urllib库的基本使用

    Python爬虫入门之Urllib库的基本使用

    urllib和urllib2库是学习Python爬虫最基本的库,利用这个库我们可以得到网页的内容,并对内容用正则表达式提取分析,得到我们想要的结果。1.分分钟扒一个网页下来怎样扒网页呢?其实就是根据URL来获取它的网页信息,虽然我们在浏览器中看到的是一幅幅优美的画面,但是其实是由浏览器解释才呈现出来...

    kavinkavin 2018.05.12 2086浏览 0
  • linux下自动分区、格式化、挂载脚本

    linux下自动分区、格式化、挂载脚本

     此脚本主要功能是自动检测是否有尚未分区的数据盘,格式化新的数据盘并自动挂载,一键式检测是否有尚未分区的数据盘,并能对其格式化和自动挂载,省去了复杂的命令和步骤touch出一个新文件disk.sh,并将以下内容复制进文件内,执行 chmod +x disk.sh&nbs...

    kavinkavin 2018.05.09 2959浏览 0