个人介绍

专长领域:大模型训练与推理、MoE架构设计\TP/PP/DP/EP、模型量化与压缩、Transformer优化、KV Cache管理、FlashAttention

核心技能
PyTorch DeepSpeed Megatron-LM vLLM TensorRT-LLM Transformers Python C C++ CUDA Go Shell
精选作品集
工作经历
教育背景