线性模型

发表于 2017-11-11 更新于 2023-11-22 本文字数： 695 阅读时长 ≈ 3 分钟

能不能使用线性分类器得到形状为圆圈的决策边界？

**the prediction is driven by the score w · φ(x)**，其中x是原始输入，φ(x)是提取到的特征

机器学习问题：定义优化问题，求解得到w（在 φ(x)固定的情况下）

构造特征：

定义特征：

定义特征时一定要明确特征的含义

模型的表达（表现）能力——Expressivity：

non-linearities in the original measurements(原始度量中的非线性) :

Non-monotonicity(非单调性)：
- 体温和健康程度的关系就不是单调的，你不能说体温越高越健康，反之亦然
- φ(x) = [1, temperature(x)] bad
- φ(x) = [1, (temperature(x) − 37)^2] 转换特征，利用了先验知识
- φ(x) = [1, temperature(x), temperature(x)^2] task to simple blocks
Saturation(饱和)：
- 产品推荐
- φ(x) = N(x) 购买产品的人数（受欢迎程度）和相关性，不具有线性关系
- φ(x) = logN(x) 转换特征，取对数（N with a large dynamic range）
- φ(x) = [1[0 < N(x) ≤ 10], 1[10 < N(x) ≤ 100],…]离散化，范围足够精细的话，可以非常灵活地捕捉常规关系
Interaction between features(特征组合)：
- 根据身高、体重预测健康病人状况
- φ(x) = [height(x), weight(x)] #没能捕获身高体重的关系
- φ(x) = (52 + 1.9(height(x) − 60) − weight(x))^2 #组合输入得到新的特征，利用了外界知识
- φ(x) = [1, height(x), weight(x), height(x)^2, weight(x)^2, height(x)weight(x)] #添加包含多个度量的特征

Linear in what？

小结：