python爬虫教程之爬取百度贴吧并下载的示例 -电脑资料

电脑资料 时间:2019-01-01 我要投稿
【www.unjs.com - 电脑资料】

   

    测试url:http://tieba.baidu.com/p/27141123322?pn=

    begin 1

    end  4

    复制代码代码如下:

    import string ,urllib2

    def baidu_tieba(url,begin_page,end_page):

    for i in range(begin_page, end_page+1):

    sName = string.zfill(i,5)+ '.html'

    print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'

    f = open (sName,'w+')

    m = urllib2.urlopen(url + str(i)).read()

    f.write(m)

    f.close()

    bdurl = str(raw_input('url: \n'))

    begin_page = int(raw_input('begin :\n'))

    end_page = int(raw_input('end : \n'))

    baidu_tieba(bdurl,begin_page,end_page)

   

您可能感兴趣的文章:

Python天气预报采集器实现代码(网页爬虫)

python实现的一只从百度开始不断搜索的小爬虫

python模拟 登陆功能( 爬虫)

Python爬虫框架Scrapy安装使用步骤

python抓取网页图片示例(python爬虫)

Python开发实例分享bt种子爬虫程序和种子解析

一则python3的简单爬虫代码

    QQ空间 搜狐微博 人人网 开心网 百度搜藏更多

    Tags:python 爬虫 百度贴吧

    复制链接收藏本文打印本文关闭本文返回首页

    上一篇:python处理json数据中的中文

    下一篇:windows下wxPython开发环境安装与配置方法

   

相关文章

2014-06-06pycharm 使用心得(八)如何调用另一文件中的函数

2011-05-05Python模块学习 re 正则表达式

2014-06-06python在linux中输出带颜色的文字的方法

2013-02-02把大数据数字口语化(python与js)两种实现

2014-02-02python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签

2014-03-03pyqt4教程之messagebox使用示例分享

2008-09-09比较详细Python正则表达式操作指南(re使用)

2013-02-02解决谷歌搜索技术文章时打不开网页问题的python脚本

2014-03-03使用python删除nginx缓存文件示例(python文件操作)

2014-04-04Python和php通信乱码问题解决方法

   

文章评论

   

最 近 更 新

   

python ip正则式

Python程序设计入门(4)模块和包

python的正则表达式re模块的常用方法

python实现监控windows服务并自动启动服务

wxPython中文教程入门实例

Python Web开发模板引擎优缺点总结

python装饰器使用方法实例

python zip文件 压缩

python encode和decode的妙用

python实现socket端口重定向示例

   

热 点 排 行

   

Python入门教程 超详细1小时学会

python 中文乱码问题深入分析

比较详细Python正则表达式操作指

Python字符串的encode与decode研

Python open读写文件实现脚本

Python enumerate遍历数组示例应

Python 深入理解yield

Python+Django在windows下的开发

python 文件和路径操作函数小结

python 字符串split的用法分享

最新文章