个人介绍
专长领域:大模型训练与推理、MoE架构设计\TP/PP/DP/EP、模型量化与压缩、Transformer优化、KV Cache管理、FlashAttention
核心技能
PyTorch
DeepSpeed
Megatron-LM
vLLM
TensorRT-LLM
Transformers
Python
C
C++
CUDA
Go
Shell
精选作品集
工作经历
教育背景