测试url:http://tieba.baidu.com/p/27141123322?pn=
begin 1
end 4
复制代码代码如下:
import string ,urllib2
def baidu_tieba(url,begin_page,end_page):
for i in range(begin_page, end_page+1):
sName = string.zfill(i,5)+ '.html'
print '正在下载第' + str(i) + '个网页,并将其存储为' + sName + '..........'
f = open (sName,'w+')
m = urllib2.urlopen(url + str(i)).read()
f.write(m)
f.close()
bdurl = str(raw_input('url: \n'))
begin_page = int(raw_input('begin :\n'))
end_page = int(raw_input('end : \n'))
baidu_tieba(bdurl,begin_page,end_page)
您可能感兴趣的文章:
Python天气预报采集器实现代码(网页爬虫)
python实现的一只从百度开始不断搜索的小爬虫
python模拟 登陆功能( 爬虫)
Python爬虫框架Scrapy安装使用步骤
python抓取网页图片示例(python爬虫)
Python开发实例分享bt种子爬虫程序和种子解析
一则python3的简单爬虫代码
QQ空间 搜狐微博 人人网 开心网 百度搜藏更多
Tags:python 爬虫 百度贴吧
复制链接收藏本文打印本文关闭本文返回首页
上一篇:python处理json数据中的中文
下一篇:windows下wxPython开发环境安装与配置方法
相关文章
2014-06-06pycharm 使用心得(八)如何调用另一文件中的函数
2011-05-05Python模块学习 re 正则表达式
2014-06-06python在linux中输出带颜色的文字的方法
2013-02-02把大数据数字口语化(python与js)两种实现
2014-02-02python3模拟百度登录并实现百度贴吧签到示例分享(百度贴吧自动签
2014-03-03pyqt4教程之messagebox使用示例分享
2008-09-09比较详细Python正则表达式操作指南(re使用)
2013-02-02解决谷歌搜索技术文章时打不开网页问题的python脚本
2014-03-03使用python删除nginx缓存文件示例(python文件操作)
2014-04-04Python和php通信乱码问题解决方法
文章评论
最 近 更 新
python ip正则式
Python程序设计入门(4)模块和包
python的正则表达式re模块的常用方法
python实现监控windows服务并自动启动服务
wxPython中文教程入门实例
Python Web开发模板引擎优缺点总结
python装饰器使用方法实例
python zip文件 压缩
python encode和decode的妙用
python实现socket端口重定向示例
热 点 排 行
Python入门教程 超详细1小时学会
python 中文乱码问题深入分析
比较详细Python正则表达式操作指
Python字符串的encode与decode研
Python open读写文件实现脚本
Python enumerate遍历数组示例应
Python 深入理解yield
Python+Django在windows下的开发
python 文件和路径操作函数小结
python 字符串split的用法分享