跳转至

线性代数

标量、向量、矩阵、张量、运算、范数 说明的是,上面的名词都是在线代中的名词,在这个语境内

标量

仅包含一个数字的量,称为标量(scalar),由普通小写字母标识(\(x、y、z\))。同时,标量也是只有一个元素的张量。

向量

由标量组成的列表,通常记为粗体、小写的字母(\(\mathbf{x、y、x}\)),向量是一维的张量。 大量文献认为列向量是向量的默认方向,在本书中也是如此。

矩阵

通常使用大写字母标识矩阵(\({X、Y、Z}\)),使用\({A}\in {R}^{m\times n}\)

张量

通常使用粗体、大写字母标识(\(\mathbf {\textsf {X,Y,Z}}\)

张量的基本性质: - 任何元素的一元运算都不会改变其形状 - 给定具有相同形状的任意两个张量,任何按元素二元运算的结果都将是相同形状的张量。 - 加法 - Hadamard积,通常用\(\odot\)表示 - 降维 - 点积 相同位置的按元素乘积的和,可以通过执行按元素乘法,然后求和来表示两个向量的点积。

  • 矩阵-向量积 \(\mathbf{Ax}\)
  • 矩阵-矩阵乘法
  • 范数

向量的求导问题

向量对向量求导

倒三角的含义 Nabla算子

矩阵求导公式

机器学习数学基础之矩阵求导

标量对向量求导

假设一个函数 \(f(x)=X^TX\) 其中 \(\small{X}\normalsize{=[x_1,x_2]^T}\)。然后,我们针对x的每个元素计算导数,结果是\(2X^T\)

先介绍向量的两种运算,一个行向量乘以一个列向量称作向量的内积,又叫作点积,结果是一个数;

一个列向量乘以一个行向量称作向量的外积,外积是一种特殊的克罗内克积,结果是一个矩阵,

矩阵&向量的求导方法推导及常用公式总结和证明(一)

向量对向量求导的时候需要考虑是numerator layout还是denominator layout,所以既可以是W也可以是W.T,不过一般采用后者

顺序阅读: 矩阵求导的本质与分子布局、分母布局的本质 矩阵求导公式的数学推导 基础篇 矩阵求导公式的数学推导-进阶篇