机器学习分享

2018年11月20日 0 条评论 28 次阅读 0 人点赞

 

什么是机器学习

让机器从数据中学习,进而得到一个更加符合现实规律的模型,通过对模型的使用使得机器比以往表现的更好

通俗来讲,让代码学着干活

 

 

机器学习

寻找一个函数

 

 

 

 

一些基本的概念

  • 特征:自变量
  • 标签:因变量

 

  • 训练集、测试集

 

房屋数据集

 

学习的种类

  • 有监督学习:提供标签,分类、回归
  • 无监督学习:无标签,聚类

两大痛点

  • 维度灾难:数据量和特征数
  • 过拟合:模型泛化能力

学习的流程

  • 特征工程:
    • 预处理:数据重塑、缺失值处理(补全、统计为缺失特征)
    • 特征工程:特征没做好,参数调到老。在已有的特征上生成新的特征,数值、类别
    • 特征选择、降维:基于相关系数、基于模型、基于算法:PCA
  • 训练模型、调参:单模型,多模型融合,集成
  • 评估模型:正确率(Acurracy)、均方误差(MAE)

 

代码实现

 

你需要的都在这里:https://scikit-learn.org/

lyssom

这个人太懒什么东西都没留下

文章评论(0)