网络编程
位置: 首页>> 网络编程>> Python编程>> python爬取51job中hr的邮箱

python爬取51job中hr的邮箱

作者:lijiao  发布时间:2022-11-06 14:00:54 

标签:python,爬取,邮箱

本文实例为大家分享了python爬取51job中hr的邮箱具体代码,供大家参考,具体内容如下


#encoding=utf8
import urllib2
import cookielib
import re
import lxml.html
from _ast import TryExcept
from warnings import catch_warnings

f = open('/root/Desktop/51-01.txt','a+')

def read(city):
 url = 'http://www.51job.com/'+city
 cj = cookielib.MozillaCookieJar()
 cookie_support = urllib2.HTTPCookieProcessor(cj)
 opener = urllib2.build_opener(cookie_support)
 opener.addheaders = [('User-agent','Mozilla/5.0 (X11; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0 Iceweasel/38.3.0')]
 urllib2.install_opener(opener)
 response = urllib2.urlopen(url)
 http = response.read()
 rex = 'http://jobs.51job.com/hot/.*?html'
 value = re.findall(rex, http)
 for i in value:
   print i
   try:
     readpage(i)
   except:
     pass

def readpage(url):
 cj = cookielib.MozillaCookieJar()
 cookie_support = urllib2.HTTPCookieProcessor(cj)
 opener = urllib2.build_opener(cookie_support)
 opener.addheaders = [('User-agent','Mozilla/5.0 (X11; Linux x86_64; rv:38.0) Gecko/20100101 Firefox/38.0 Iceweasel/38.3.0')]
 urllib2.install_opener(opener)
 html = urllib2.urlopen(url,timeout = 2).read()
 doc = lxml.html.fromstring(html)
 rex = r'[\w\.-]+@(?:[A-Za-z0-9]+\.)+[A-Za-z]+'
 results = doc.xpath('//div[@class="tmsg inbox"]/div[@class="con_msg"]/div[@class="in"]/p/text()')
 for i in results:
   xx = re.compile(rex)
   for j in xx.findall(i):
     print j
     f.write(j+'\n')
     f.flush()

if __name__ == '__main__':
 city_list = ['zhangjiagang','zhanjiang','zhaoqing','zibo']
 for i in city_list:
   f.write(i+'\n')
   f.flush()
   try:
     read(i)
   except:
     pass
 f.flush()
 f.close()

city_list大家自己整理一下,只能帮你们到这里了,谢谢大家的阅读,继续关注脚本之家更多精彩内容。

0
投稿

猜你喜欢

  • go流程控制代码详解
    if•Go里面if条件判断语句中不需要括号,条件判断语句里面允许声明一个变量,任何在这里声明的变量都可以在所有的条件分支中使用。if x :
  • 中国移动G3笔记本全Flash 网站
    在看到7yue博客——“换手来用”的思考 有这么一句话:RIA是一个更趋向于“体验”设计的领域,不仅仅包括“开发人员”,还包括“设计人员”,
  • asp封装dll源码分享
    从4年之前什么都不知道,到现在对代码的一网情深,感谢无忧的兄弟姐妹的帮助,感谢无忧给我们提供了这么好的交流平台。现将最近几天捣鼓的asp封装
  • 在网页中实现细线边框的两种方法
    很多朋友都有过制作网页的经历,如今,众多网页的设计都用到了表格。这样不仅有利于网页的维护,同时,提高了网页的观赏性。在众多网页制作风格中,细
  • 将数组中指定数量的元素移动数组后面的实现代码
    如下所示:        static void Main()&nbs
  • 如何创建第一个Pygame程序
    目录初始化程序创建Surface对象事件监听游戏循环Pygame 作为一个入门级的游戏开发库,其实并不难学,只要掌握 Python 编程的相
  • asp 数组 重复删除函数代码
    因为要写个东西用到,所以百度了一下,居然有朋友乱写,而且比较多,都没有认真测试过,只对字符可以,但是对数字就不可以,而且通用性很差,需要修改
  • 标志设计如何正确使用字体
    在标志设计中文字与图形元素总是紧密配合,只有恰当的字体与图形搭配时才能发挥最大的视觉效果。这也意味着你不能抛开图案,只是一厢情愿地选择你自己
  • js和jquery判断数据类型的4种方法总结
    1.typeoftypeof是一个运算符,有2种使用方式:typeof(表达式)和typeof 变量名,第一种是对表达式做运算,第二种是对变
  • Pycharm操作Git及GitHub的步骤详解
    项目开发中,代码管理肯定离不开git操作,Pycharm中没有复杂的命令操作,只需要进行一些简单的菜单操作就可以方便的实现版本管理,下面分别
  • Python上传package到Pypi(代码简单)
    废话不多说了,直接给大家贴代码了。编写setup.py后$ python setup.py register$ python setup.p
  • python 爬取吉首大学网站成绩单
    项目地址:https://github.com/chen0495/pythonCrawlerForJSU环境python 3.5即以上req
  • javascript设计模式交流(一)Singleton Pattern
    即使是简单的脚本语言,应用良好的模式可以得到非常“优美”的代码和较高的效率。尤其是对于交互要求较高的B/S系统,非常有必要用设计模式来优化代
  • Oracle Session每日统计功能实现
    背景客户最近有这样的需求,想通过统计Oracle数据库活跃会话数,并记录在案,利用比对历史的活跃会话的方式,实现对系统整体用户并发量有大概的
  • asp fso创建与删除文件与文件夹
    与前面一样我们会用fso来对文件或文件夹进行创建与删除操作了,其实fso有强大的功能但非常危险的哦,下面我们不来看看删除实例吧,在这些例子,
  • PHP session反序列化漏洞超详细讲解
    session请求过程当第一次访问网站时,Seesion_start()函数就会创建一个唯一的Session ID,并自动通过HTTP的响应
  • 两个不太常用的 CSS Hack
    1、仅 Safari 和 Opera 识别的 Hack@media all and (min-width:&n
  • Django跨域请求CSRF的方法示例
    web跨域请求1.为什么要有跨域限制举个例子:1.用户登录了自己的银行页面 http://mybank.com,http://mybank.
  • Python实现读取SQLServer数据并插入到MongoDB数据库的方法示例
    本文实例讲述了Python实现读取SQLServer数据并插入到MongoDB数据库的方法。分享给大家供大家参考,具体如下:# -*- co
  • Python实现微信机器人的方法
    最近在学python的过程中无意间发现一个python库:wxpy,其可以实现让微信自动接收、处理消息并进行回复的一系列功能。感觉挺有意思的
手机版 网络编程 asp之家 www.aspxhome.com

聚圣源宝宝起小名洋气点男孩女孩免费智能起名高兴的近义词怎样加盟味千拉面上帝赐的孩子要怎么起名字建筑劳务有限公司起名册子给蔬菜企业起名起名100分名字推荐冯起名起名女孩免费微信起名字大全2021岗位大练兵总结饭店店怎么起名商标起名好词语贵阳电视台任姓起名字大全男孩2021第一炉香百度云普姓女孩起名字大全我的物品能升级神探夏洛克第2季首发电影品牌起名字大全免费广州恒大亚冠比分泰拉瑞亚房子设计图皓宸的起名意义第六届东亚运动会凤雏是谁通讯行业的注册公司起名艺名起名网免费取名女三重一大是指什么淀粉肠小王子日销售额涨超10倍罗斯否认插足凯特王妃婚姻让美丽中国“从细节出发”清明节放假3天调休1天男孩疑遭霸凌 家长讨说法被踢出群国产伟哥去年销售近13亿网友建议重庆地铁不准乘客携带菜筐雅江山火三名扑火人员牺牲系谣言代拍被何赛飞拿着魔杖追着打月嫂回应掌掴婴儿是在赶虫子山西高速一大巴发生事故 已致13死高中生被打伤下体休学 邯郸通报李梦为奥运任务婉拒WNBA邀请19岁小伙救下5人后溺亡 多方发声王树国3次鞠躬告别西交大师生单亲妈妈陷入热恋 14岁儿子报警315晚会后胖东来又人满为患了倪萍分享减重40斤方法王楚钦登顶三项第一今日春分两大学生合买彩票中奖一人不认账张家界的山上“长”满了韩国人?周杰伦一审败诉网易房客欠租失踪 房东直发愁男子持台球杆殴打2名女店员被抓男子被猫抓伤后确诊“猫抓病”“重生之我在北大当嫡校长”槽头肉企业被曝光前生意红火男孩8年未见母亲被告知被遗忘恒大被罚41.75亿到底怎么缴网友洛杉矶偶遇贾玲杨倩无缘巴黎奥运张立群任西安交通大学校长黑马情侣提车了西双版纳热带植物园回应蜉蝣大爆发妈妈回应孩子在校撞护栏坠楼考生莫言也上北大硕士复试名单了韩国首次吊销离岗医生执照奥巴马现身唐宁街 黑色着装引猜测沈阳一轿车冲入人行道致3死2伤阿根廷将发行1万与2万面值的纸币外国人感慨凌晨的中国很安全男子被流浪猫绊倒 投喂者赔24万手机成瘾是影响睡眠质量重要因素春分“立蛋”成功率更高?胖东来员工每周单休无小长假“开封王婆”爆火:促成四五十对专家建议不必谈骨泥色变浙江一高校内汽车冲撞行人 多人受伤许家印被限制高消费

聚圣源 XML地图 TXT地图 虚拟主机 SEO 网站制作 网站优化