个人介绍
你好,我是一名专注的Python开发者,擅长数据爬取、清洗与自动化熟练使用requests、Beautifulsoup、正则表达式等工具,能从各类复杂网页中精准提取结构化数据如Excel、CSV、JSON格式掌握Selenium,能处理需要模拟浏览器操作或JavaScript渲染的网站注重代码简洁性与健壮性,交付内容包含清晰注释和使用说明,并提供15天免费售后修复支持,确保项目稳定运行。无论您是数据采集、报表自动化,还是小功能定制,我都能为您提供高效、可靠的解决方案。期待与您合作!
核心技能
python
爬虫
数据采集
自动化脚本
精选作品集
手机行业价格信息采集
作品名称:中关村在线热门手机数据采集
项目背景:爬取中关村在线手机列表页的热门手机数据,包括手机图片、名称、参考价格、评分、点评数、京东/天猫价格及购买链接,共9个字段,数据量不少于150条。
技术栈:requests + BeautifulSoup + pandas + re我的工作:
分析网站结构,确认列表页为静态分页(URL规律递增),设计循环翻页策略。
使用requests携带Cookie和代理IP发送请求,配合随机延时绕过基础反爬。
采用Beautifulsoup 定位下的每个,逐一提取手机信息。
获取真实.src属性并下载保存到本地文件夹,用正则清洗文件名中的非法字符。
使用pandas清洗价格,将9个字段按指定顺序导出为Excel文件。成果:成功爬取170余条手机数据,图片全部下载到位,交付 z01_phone.xlsx及完整代码,客户验收通过
工作经历
贵州融创智云信息科技有限公司 · 数据部
2025-01-22 - 1
教育背景
贵州交通职业大学 · 机电电子工程技术
2020-09-01