今天我们将学习逻辑回归(logistics regression),由于逻辑回归是基于线性回归的特殊变化,故还没有掌握线性回归的小伙伴,可以先点击这里,传送门:如何用线性回归做数据分析?接下来,我将用最简单通俗的语言来为大家介绍逻辑回归模型及其应用。
逻辑回归是解决二分类问题的监督学习算法,用来估计某个类别的概率。其直接预测值是表示0-1区间概率的数据,基于概率再划定阈值进行分类,而求解概率的过程就是回归的过程。
逻辑回归应用于数据分析的场景主要有三种:
-
驱动力分析:某个事件发生与否受多个因素所影响,分析不同因素对事件发生驱动力的强弱(驱动力指相关性,不是因果性);
-
预测:预测事件发生的概率;
-
分类:适合做多种分类算法、因果分析等的基础组件;
01
下图是之前讲到的线性回归模型的数据分布,线性回归是用一条线来拟合自变量和因变量之间的关系,我们可以看到其输出结果y是连续的。例如我们想预测不同用户特征对所使用产品的满意分,可以采用线性回归模型。但是如果我们想根据这些因素去判断用户的性别,或者是否推荐使用等,之前的线性回归就不适用了,这时,我们就要用到逻辑回归进行二分类了。但是分类模型输出结果却需要是离散的,如何把连续型的y转化为取值范围0-1的数值呢?


-
将自变量特征输入 -
定义自变量的线性组合y,即针对自变量线性回归 -
将线性回归结果y映射到sigmoid函数,生成一个0-1范围取值的函数概率值 -
根据概率值,定义阈值(通常为0.5),判定分类结果的正负
02




将逻辑回归的cost函数简化,即得出:
将逻辑回归cost函数带入目标函数通用形式,即可形成逻辑回归最终的目标函数:
03
声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)