【SVM】简单介绍（二）,lg kg90_技术栈专业化分层

文件名：【SVM】简单介绍（二）,lg kg90 【SVM】简单介绍（二） 1、SVM另一种推法

我们不管分类平面，直接去假设Margin的两个边界： $={x:w⋅x+b=−1}\begin{aligned} & \text { Plus-plane }=\{\boldsymbol{x}: \boldsymbol{w} \cdot \boldsymbol{x}+b=+1\} \\ & \text { Minus-plane }=\{\boldsymbol{x}: \boldsymbol{w} \cdot \boldsymbol{x}+b=-1\} \end{aligned}$ 这个时候Margin就是这两个平面之间的距离了

回忆一下： Given 2 parallel lines with equations $a x+b y+c_1=0$ and $a x+b y+c_2=0$ the distance between them is given by: $d=∣c2−c1∣a2+b2d=\frac{\left|c_2-c_1\right|}{\sqrt{a^2+b^2}}$ 于是就有：

maximize $2∥w∥\frac{2}{\|\mathbf{w}\|}$ such that For $yi=+1,wTxi+b≥1y_i=+1, \quad \mathbf{w}^T \mathbf{x}_i+b \geq 1$ For $yi=−1,wTxi+b≤−1y_i=-1, \quad \mathbf{w}^T \mathbf{x}_i+b \leq-1$

进一步的，有 $∀xi∈D:yi(xi⋅w+b)≥1\begin{aligned} & \underset{\mathbf{w}, b}{\operatorname{argmin}} \sum_{i=1}^d w_i^2 \\ & \text { subject to } \forall \mathbf{x}_i \in D: y_i\left(\mathbf{x}_i \cdot \mathbf{w}+b\right) \geq 1 \end{aligned}$

模型是一样的

2、二次规划（Quadratic Programming）

二次规划问题是这样的 $arg⁡max⁡uc+dTu+uTRu2\text { Find } \underset{\mathbf{u}}{\arg \max } \quad c+\mathbf{d}^T \mathbf{u}+\frac{\mathbf{u}^T R \mathbf{u}}{2}$ 若干个不等式约束 $a11u1+a12u2+…+a1mum≤b1a21u1+a22u2+…+a2mum≤b2:an1u1+an2u2+…+anmum≤bn\begin{gathered} a_{11} u_1+a_{12} u_2+\ldots+a_{1 m} u_m \leq b_1 \\ a_{21} u_1+a_{22} u_2+\ldots+a_{2 m} u_m \leq b_2 \\ : \\ a_{n 1} u_1+a_{n 2} u_2+\ldots+a_{n m} u_m \leq b_n \end{gathered}$ 若干个等式约束 $a(n+1)1u1+a(n+1)2u2+…+a(n+1)mum=b(n+1)a(n+2)1u1+a(n+2)2u2+…+a(n+2)mum=b(n+2):a(n+e)1u1+a(n+e)2u2+…+a(n+e)mum=b(n+e)\begin{gathered} a_{(n+1) 1} u_1+a_{(n+1) 2} u_2+\ldots+a_{(n+1) m} u_m=b_{(n+1)} \\ a_{(n+2) 1} u_1+a_{(n+2) 2} u_2+\ldots+a_{(n+2) m} u_m=b_{(n+2)} \\ : \\ a_{(n+e) 1} u_1+a_{(n+e) 2} u_2+\ldots+a_{(n+e) m} u_m=b_{(n+e)} \end{gathered}$ 而我们线性SVM要求解的问题是 $(x⃗i,yi)\begin{aligned} & \left\{\vec{w}^*, b^*\right\}=\min _{\vec{w}, b} \sum_i w_i^2 \\ & \text { subject to } y_i\left(\vec{w} \cdot \vec{x}_i+b\right) \geq 1 \text { for all training data }\left(\vec{x}_i, y_i\right) \end{aligned}$ 其实本质上就是一个QP问题 ${w⃗∗,b∗}=argmax⁡w⃗,b{0+0→⋅w⃗−w⃗TInw⃗}\left\{\vec{w}^*, b^*\right\}=\underset{\vec{w}, b}{\operatorname{argmax}}\left\{0+\overrightarrow{0} \cdot \vec{w}-\vec{w}^T \mathbf{I}_{\mathbf{n}} \vec{w}\right\}$ $y1(w⃗⋅x⃗1+b)≥1y2(w⃗⋅x⃗2+b)≥1…yN(w⃗⋅x⃗N+b)≥1\begin{aligned} & y_1\left(\vec{w} \cdot \vec{x}_1+b\right) \geq 1 \\ & y_2\left(\vec{w} \cdot \vec{x}_2+b\right) \geq 1 \\ & \ldots \\ & y_N\left(\vec{w} \cdot \vec{x}_N+b\right) \geq 1 \end{aligned}$

3、Soft Margin SVM

咱们的Hard Margin SVM要求样本必须是线性可分的（看它的约束条件），那么问题来了，要是样本线性不可分呢？

那么咱们就希望Margin大的同时，让分类的损失尽量小一点，于是问题就变为

Minimize $w⋅w+C\boldsymbol{w}\cdot \boldsymbol{w}+C$ (#train errors)

这样问题就来了。首先这不再是一个QP问题，QP问题的求解方法很成熟；其次这边有一个超参数C，这个参数又叫tradeoff parameter。C越大说明你更希望分类误差小一点，C越小说明你更希望Margin大一点，所以这边C的取值就是一门学问了。我们将误差建模为分类错误点到分类平面的距离 ${w⃗∗,b∗}=min⁡w⃗,b∑i=1dwi2+c∑j=1Nεjy1(w⃗⋅x⃗1+b)≥1−ε1y2(w⃗⋅x⃗2+b)≥1−ε2…yN(w⃗⋅x⃗N+b)≥1−εN\begin{aligned} & \left\{\vec{w}^*, b^*\right\}=\min _{\vec{w}, b} \sum_{i=1}^{\mathrm{d}} w_i^2+c \sum_{j=1}^N \varepsilon_j \\ & y_1\left(\vec{w} \cdot \vec{x}_1+b\right) \geq 1-\varepsilon_1 \\ & y_2\left(\vec{w} \cdot \vec{x}_2+b\right) \geq 1-\varepsilon_2 \\ & \ldots \\ & y_N\left(\vec{w} \cdot \vec{x}_N+b\right) \geq 1-\varepsilon_N \end{aligned}$

如果 $εi<0?\varepsilon_i<0?$ ，这是我们不想看到的，因为当样本分类正确时，我们希望损失是 $0$ 。 ${w⃗∗,b∗}=min⁡w⃗,b∑i=1dwi2+c∑j=1Nεjy1(w⃗⋅x⃗1+b)≥1−ε1,ε1>=0y2(w⃗⋅x⃗2+b)≥1−ε2,ε2>=0…yN(w⃗⋅x⃗N+b)≥1−εN,εN>=0\begin{aligned} & \left\{\vec{w}^*, b^*\right\}=\min _{\vec{w}, b} \sum_{i=1}^{\mathrm{d}} w_i^2+c \sum_{j=1}^N \varepsilon_j \\ & y_1\left(\vec{w} \cdot \vec{x}_1+b\right) \geq 1-\varepsilon_1 ,\varepsilon_1>=0\\ & y_2\left(\vec{w} \cdot \vec{x}_2+b\right) \geq 1-\varepsilon_2 ,\varepsilon_2>=0\\ & \ldots \\ & y_N\left(\vec{w} \cdot \vec{x}_N+b\right) \geq 1-\varepsilon_N,\varepsilon_N>=0 \end{aligned}$

想象一下，一个样本点错得很离谱，离分界面无穷大，那么其对应的损失也是无限大，所以我们说，SVM对噪声是很敏感的

SVM的损失函数是Hinge loss $hinge⁡(x)=max⁡(1−x,0)\operatorname{hinge}(x)=\max (1-x, 0)$

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

【SVM】简单介绍（二）,lg kg90

2016京津唐电力直接交易将于10月21日正式启动！（京津唐电力中长期交易规则）

2016全球可再生能源投资额为2416亿美元（2016全球可再生能源投资额为2416亿美元）

【Proteus仿真】【STM32单片机】定时智能插座开关,搡60一70老女人老熟女

【QT5-程序控制电源-RS232-SCPI协议-上位机-基础样例【1】】,phiaton（qt上位机源码）

【Qt QML入门】Image,柯达数码相机怎么样

【Qt开发流程】之对象模型1：信号和槽,gt630m（qt model）

【Qt开发流程】之对象模型2：属性系统,泡泡手机网（qt 属性系统）

【Qt开发流程】之打印文档,柯达v570（柯达可以打印文件吗）

【RK3399Pro学习笔记】九、ROS客户端Client的编程实现,热门手机（ros配置教程）

【RabbitMQ】RabbitMQ详解(二),推荐几个安全没封的网站2021

【RabbitMQ（day4）】SpringBoot整合RabbitMQ与MQ应用场景说明,三国之杀场（rabbit mq应用场景）