
-
欧几里得距离-直线距离,不适合高维度数据,对某一维度大数值差异更加敏感; -
曼哈顿距离-也叫出租车距离,用来标明两个点在标准坐标系上的绝对轴距总和,只计算水平或垂直距离,对某一维度大数值差异不敏感; -
Hamming距离-可用来测量含有分类值的向量之间的距离; -
余弦距离-通过计算两个向量的夹角余弦值来评估相似度,适用于结果与数据中特征的取值大小无关,而与不同特征之间比值有关的案例;
k-means算法原理





k-means数据分析实战案例


-
数据准备:数据获取、数据清洗、数据变换等步骤,重点是针对分析目的,进行特征选择以及特征标准化; -
数据建模:使用k-means算法进行数据建模; -
后续分析:聚类模型的特征描述分析,基于业务问题,进一步分析;







声明:本站所有文章,如无特殊说明或标注,均为本站原创发布。任何个人或组织,在未征得本站同意时,禁止复制、盗用、采集、发布本站内容到任何网站、书籍等各类媒体平台。如若本站内容侵犯了原著者的合法权益,可联系我们进行处理。
评论(0)