SmoothQuant 量化详解 【2024-10-30】详细总结了 LLM 量化的难点:激活值中出现在特定通道的离群值使得激活值分布不均值导致激活难以量化,并给出了SmoothQuant 算法原理的详细描述。
RoPE 位置编码算法详解 【2024-10-24】旋转位置编码(Rotary Position Embedding,RoPE)是论文 Roformer Enhanced Transformer With Rotray Position Embedding 提出的一种能够将相对位置信息依赖集成到 self-attention 中并提升 transformer 架构性能的位置编码方式。
Sinusoida 位置编码详解 【2024-10-23】Sinusoida 位置编码也叫三角函数位置编码,由 transformer 论文提出。位置编码的意义是用于表示序列中某个元素的位置,它为每个位置分配一个独特的表示。
位置编码算法背景知识 【2024-10-22】理解 RoPE 位置编码算法的原理和推导公式之前得先具备一些背景知识,主要是关于三角函数、旋转矩阵、直角坐标系、欧几里得内积的相关概念和公式,可以先快速阅览本章内容,后续关于 RoPE 算法的推导不理解的时候,再来细看相关公式和概念即可。