softmax与sigmoid

sigmoid函数是一种常用的非线性函数,也被称为逻辑函数(Logistic function)。
它将任意实数映射到一个介于0和1之间的值。
将线性输出z转化为一个概率,这个概率表示样本属于正例的可能性。

Sigmoid公式

在softmax归中,我们使用softmax函数将输出值zk同样转化为概率,这个概率表示样本属于第k个类别的可能性。

softmax公式

当softmax类别数为2时,softmax回归和逻辑回归的输出等价的。

softmax类别为2

softmax类别数为2公式推导

设有两个类别,类别1和类别0,某样本x属于1或0的概率为p(y=1)和p(y=0)。

在逻辑回归中,使用sigmoid函数来预测正例的概率,结果p(y=1)=sigmoid(z)。

在softmax回归中,类别k的概率为,softmax(zk)。
根据softmax函数,类别0和类别1的概率分别是softmax(z0)、softmax(z1)。
将这两个等式相除,得到p(y=0)/p(y=1)=e^z0/e^z1。

softmax类别为2公式推导1

将p(y=0)=1-p(y=1),带入这个式子,得到,(1 - p(y=1)) / p(y=1)= e^(z0-z1)。

softmax类别为2公式推导2

将p(y=1),表示出来,得到 1/ (1+e^(z0-z1))。
这时我们将z0看做是0,或者将z0-z1看做是一个整体,对应-z,就会得到逻辑回归的形式了。

softmax类别为2公式推导3

可以得出结论,在处理二分类问题时,softmax回归和逻辑回归,实际上是完全等价的模型。