Data mining 2018-11-16 Note

魔法师LQ

回顾

调查设计(统计学上的小例子)

  • 互斥
  • True/False

云计算

  • 多:浪费;少,数据洪峰
  • pay as you go
  • 软件,平台,基础infrastructure设施即服务

并行计算

串行$\to$并行

  • aim:快
  • CPU$\to$GPU
  • 适合图像$\to$通用计算

要有敏感性。

可以适度了解GPU编程。

release vs debug模式

xx实验室,xx公司人均有多少GPU卡

  • “智能”芯片
  • 嵌入式计算设备:摄像头,MIC,等
  • 并行也有代价
  • 并非所有任务都要用并行

大数据

  • MapReduce
    • map: 隐射(放)
    • reduce: 规约(收)

数据+算法+计算=数据挖掘

没有免费的午餐原则

  • 没有哪个算法始终是比别的好
  • 考虑的因素:可解释性,计算复杂度,可用性
  • 从简单到复杂
  • 能做什么不能做什么
    • 例如,预测股票,彩票