第1章 开始二人之旅
本章知识小结:
- 1、机器学习:是指机器通过统计学算法,对大量历史数据进行学习,进而利用生成的经验模型指导业务。
- 2、回归(连续数据)、分类(有标签离散数据)、聚类(无标签离散数据)
- 3、有监督学习使用数据有标签、无监督学习使用无标签数据。
1、对机器学习的兴趣
机器学习能做什么? 鉴别垃圾邮件、用图像进行人脸识别、电商网站的推荐功能之类的。
2、机器学习的重要性
计算机特别擅长处理重复的任务。所以计算机能够比人类更高效地读取大量数据、学习数据的特征并从中找出数据的模式。这样的任务也被称为机器学习或者模式识别。
数据多,存储便宜,能用GPU进行数值计算。
3、机器学习的算法
- 1、回归(regression),在处理连续数据如时间序列数据时使用的数据。
- 2、分类(classification),比如鉴别垃圾邮件归类(先要自己打标签,有二分类、多分类)。
- 3、聚类(clustering),相比于分类不需要标签,比如在100个学生中找到偏科的学生。
使用有标签的数据进行的学习称为有监督学习,使用没有标签的数据进行的学习称为无监督学习。
4、数学与编程
需要学会 高数、线代、概率论 , 但是一开始并不需要太高深的数学知识,遇到不会的查资料就可以。
本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来自 Ruiqy~!
评论