个人介绍
技术栈爬虫层:Scrapy · Selenium · Playwright · 分布式代理IP · 浏览器指纹伪装 · 验证码识别数据管道:Kafka · RabbitMQ · Airflow · Celery · Docker · K8s数据库层:MySQL(主从/分库分表)· MongoDB(副本集/分片)· Redis(集群/持久化)· ClickHouse(物化视图/实时写入)监控层:Prometheus · Grafana · ELK爬虫方面,我熟悉常见的反爬手段,比如滑块验证码、请求频率限制、参数加密等,能够分析并找到有效的绕过方案,数据采集成功率稳定在90%以上。我比较擅长把采集到的数据高效地存入数据库,并能根据业务需求做查询优化。
核心技能
数据爬取
数据库
精选作品集
工作经历
教育背景