大数据常用分析技术

Posted by Cong Li on June 24, 2018

此处写的粗糙,后续会分别细写。

1. 特征工程

  • 采集+业务理解
  • 预处理+拆分
  • 数据增强

2. 核心模型

  • 独立模型
    • 经典统计:分类(有无监督),回归,时序
    • 神经网络(层次模型):DNN,CNN,RNN,强化,迁移,GANs
    • 知识图谱(概率图模型):Bayesian,Markov
  • 混合模型
    • Bagging:RandomForest
    • Boosting:GBDT,XGBoost

3. 调参策略

  • 评估
  • 调优