4058|4

7175

帖子

2

TA的资源

版主

楼主
 

轻松看懂机器学习十大常用算法(第二节) [复制链接]

往期:轻松看懂机器学习十大常用算法(第一节)

通过本篇文章可以对ML的常用算法有个常识性的认识,没有代码,没有复杂的理论推导,就是图解一下,知道这些算法是什么,它们是怎么应用的,例子主要是分类问题。

今天的算法如下:

1.SVM

2.朴素贝叶斯

3.K最近邻算法


1. SVM

support vector machine

要将两类分开,想要得到一个超平面,最优的超平面是到两类的 margin 达到最大,margin就是超平面与离它最近一点的距离,如下图,Z2>Z1,所以绿色的超平面比较好


将这个超平面表示成一个线性方程,在线上方的一类,都大于等于1,另一类小于等于-1


点到面的距离根据图中的公式计算


所以得到 total margin 的表达式如下,目标是最大化这个 margin,就需要最小化分母,于是变成了一个优化问题


举个栗子,三个点,找到最优的超平面,定义了 weight vector=(2,3)-(1,1)


得到 weight vector 为(a,2a),将两个点代入方程,代入(2,3)另其值=1,代入(1,1)另其值=-1,求解出 a 和 截矩 w0 的值,进而得到超平面的表达式。


a 求出来后,代入(a,2a)得到的就是 support vector

a 和 w0 代入超平面的方程就是 support vector machine

 

2. 朴素贝叶斯

举个在 NLP 的应用

给一段文字,返回情感分类,这段文字的态度是positive,还是negative


为了解决这个问题,可以只看其中的一些单词


这段文字,将仅由一些单词和它们的计数代表


原始问题是:给你一句话,它属于哪一类
通过 bayes rules 变成一个比较简单容易求得的问题


问题变成,这一类中这句话出现的概率是多少,当然,别忘了公式里的另外两个概率

栗子:单词 love 在 positive 的情况下出现的概率是 0.1,在 negative 的情况下出现的概率是 0.001

 


3. K最近邻

k nearest neighbours

给一个新的数据时,离它最近的 k 个点中,哪个类别多,这个数据就属于哪一类

栗子:要区分 猫 和 狗,通过 claws 和 sound 两个feature来判断的话,圆形和三角形是已知分类的了,那么这个 star 代表的是哪一类呢


k=3时,这三条线链接的点就是最近的三个点,那么圆形多一些,所以这个star就是属于猫

 

最新回复

标记一下,后面用到了好学习学习,非常感谢分享,好人一生平安!   详情 回复 发表于 2024-6-6 17:56
点赞 关注(1)

回复
举报

365

帖子

0

TA的资源

版主

沙发
 

不错阿,有图,很直观

点评

是的,这些深奥的知识,用图可以更容易说明清楚。  详情 回复 发表于 2024-6-6 18:30
 
 

回复

1375

帖子

1

TA的资源

五彩晶圆(初级)

板凳
 

跟着仙哥学Machine Learning。。。。。

了解了超平面!

Naive Bayes真是朴素呀

理解了KNN

感谢仙哥。。。。。to be continued。。。。

 
 
 

回复

90

帖子

0

TA的资源

一粒金砂(中级)

4
 

标记一下,后面用到了好学习学习,非常感谢分享,好人一生平安!

 
 
 

回复

7175

帖子

2

TA的资源

版主

5
 
LitchiCheng 发表于 2024-6-4 19:30 不错阿,有图,很直观

是的,这些深奥的知识,用图可以更容易说明清楚。

 
 
 

回复
您需要登录后才可以回帖 登录 | 注册

随便看看
查找数据手册?

EEWorld Datasheet 技术支持

相关文章 更多>>
关闭
站长推荐上一条 1/8 下一条

 
EEWorld订阅号

 
EEWorld服务号

 
汽车开发圈

About Us 关于我们 客户服务 联系方式 器件索引 网站地图 最新更新 手机版

站点相关: 国产芯 安防电子 汽车电子 手机便携 工业控制 家用电子 医疗电子 测试测量 网络通信 物联网

北京市海淀区中关村大街18号B座15层1530室 电话:(010)82350740 邮编:100190

电子工程世界版权所有 京B2-20211791 京ICP备10001474号-1 电信业务审批[2006]字第258号函 京公网安备 11010802033920号 Copyright © 2005-2025 EEWORLD.com.cn, Inc. All rights reserved
快速回复 返回顶部 返回列表