个人介绍

深耕 RAG 检索增强生成、RPA 流程自动化、计算机视觉方向,熟练掌握 Python 全栈开发,独立完成企业本地知识库问答系统、微信智能伴聊机器人等完整项目,覆盖桌面端开发、多模态交互、Web 中控全链路。曾作为视觉算法核心开发者,助力团队斩获 RoboCup 机器人世界杯校赛亚军。

核心技能
Python Java C++ 前端 后端 RAG OCR Vibe Coding Agent 语音识别 计算机视觉 Flask Vue React
精选作品集
企业本地知识库智能问答系统
•RAG 核心工程:基于 LangChain 框架构建检索增强生成链路,选用 BAAI/bge-large-zh 模型对规章制度(Markdown)进行特征向量化并挂载 FAISS 本地索引;运用 RecursiveCharacterTextSplitter 优化文本切分策略,提升语义召回率。 •桌面端与并发控制:使用 PyQt5 独立开发带有历史会话管理(JSON 持久化)的桌面端 GUI。引入 QThread 异步工作线程机制,剥离大模型网络请求与 UI 渲染,保障界面极低延迟与零卡顿。 •多模态语音交互:自主封装 speech_manager 模块,集成外部语音引擎实现高精度语音到文本(STT)和文本到语音(TTS)的实时双向交互功能,极大拓宽了系统的应用场景。
基于 RPA 与大模型的微信智能伴聊机器人
•底层自动化引擎:规避高风险协议 Hook,采用 UIAutomation 与窗口句柄控制构建 RPA(机器人流程自动化)级底层监听机制,实现微信客户端消息的无痕捕捉、剪贴板读写与防封号自动回复。 •大模型与多模态解析:对接 Gemini LLM API,设计带窗口滑动的本地上下文记忆流(历史状态持久化);自研并迭代 OCR 处理模块(ocr_handler_improved),实现图片消息内复杂文本的高效提取与智能解析。 •Web 可视化中控端:为提升系统工程化完备度,基于 Flask 与原生 JS/CSS 独立开发了 Web 后台控制台,支持系统运行状态监控、动态参数热更
工作经历
教育背景
重庆大学 · 人工智能 2024-09-05