个人介绍

熟悉requests,selenium,BeautifulSoup等模块处理网页数据,熟练使用正则表达式,xpath,css选择器提取网页元素,熟悉使用selenium模拟登陆,pyv8进行js解析了解scrapy,scrapy-redis框架,能用scrapy-redis搭建分布式爬虫,linux下cron定时启动爬虫熟悉使用mysql,了解Mysql索引,事务,约束,多表连接查询,子查询,备份等;了解redis数据库熟练linux命令,会用rsync进行数据同步,能用grep、sed、awk等命令或编写python、shell脚本处理数据,会使用kettle进行数据抽取等操作会python django,java springmvc开发web项目;会开发android app

核心技能
Python Java
精选作品集
工作经历
眼控科技 · 技术部 2018-05-01 - 至今
1、通过爬取各个网站数据,或者线下采集各种需求数据,再将数据按照统一格式进行清洗,使用比较多的方式通过Python脚本或者linux脚本及命令进行数据批量处理,数据处理好后交个标注人员对数据进行标注再二次清洗,数据达到算法要求再统一分批次入库
教育背景
九江学院 · 汽车制造 2011-09-01