##################################################
#qq:316118740
#BLOG:http://hi.baidu.com/alalmn
# 正则 获取网页中的链接地址 并判断是否不是HTTP地址
# 刚学写的不好请大家见谅
##################################################
Python 2.7.3 (default, Apr 10 2012, 23:31:26) [MSC v.1500 32 bit (Intel)] on win32
Type "copyright", "credits" or "license()" for more information. >>> ================================ RESTART ================================ >>> http://www.baidu.com/gaoji/preferences.html https://passport.baidu.com/v2/?login&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F https://passport.baidu.com/v2/?reg®Type=1&tpl=mn&u=http%3A%2F%2Fwww.baidu.com%2F http://news.baidu.com http://tieba.baidu.com http://zhidao.baidu.com http://mp3.baidu.com http://image.baidu.com http://video.baidu.com http://map.baidu.com # 没有找到非法HTTP地址 # 没有找到非法HTTP地址 # 没有找到非法HTTP地址 http://baike.baidu.com http://wenku.baidu.com http://www.hao123.com http://www.baidu.com/more/ / 没有找到非法HTTP地址 http://www.baidu.com/cache/sethelp/index.html http://www.baidu.com/search/baidukuijie_mp.html http://e.baidu.com/?refer=888 http://top.baidu.com http://home.baidu.com http://ir.baidu.com /duty/ 没有找到非法HTTP地址 http://www.miibeian.gov.cn >>> |
标签:
正则获取网页地址