模型建立、调优流程入门

Posted by Cong Li on August 29, 2018

1. 模型建立

基于optimization theory,定义loss function,搜索parameter

  • 模型类型
    • 统计模型
      • 分类器:有监督,SVM, LR, DT;无监督,K-means, K-means++, ISODATA, GMM, SOM
      • 回归器:GLR
      • 时序模型:ARIMA,GARCH
    • 神经网络
      • 基本DNN:CNN,常用ResNet; RNN,常用LSTM
      • 强化学习
      • 迁移学习
      • GANs
    • 知识图谱,基于概率图模型
  • 模型融合-Ensemble learning
    • Bagging: Random Forest
    • Boosting: GBDT, popular used as XGBoost

2. 模型调优

基于optimization theory,定义loss function,搜索hyperparameter

  • 模型评估
    • 线下
      • 评估方式:hold-out, k-fold
      • 准确率指标:AUC, F1, Accuracy, Recall, RMSE
    • 线上
      • 评估方式: AB test
      • 活客、黏客、转化率、客单价提升
  • 参数调优
    • 类型:模型先验参数、网络层和神经元、图谱节点和边
    • 搜索方法: Grid, Random, Bayesian