你是否曾经困扰于这样的如何将相似的商品以最优的方式推荐给你的客户?
假设你是一个电商网站的运营经理,有成千上万的商品和用户,但不知道如何有效地将相似的商品分组以便推荐。或者是一个环保组织的数据分析师,希望找出那些具有相似环境影响的地区。这些问题都需要一种可以自动“分组”或“聚类”的方法。
聚类算法就是这样一种解决方案,而其中的一员名为OPTICS(Ordering Points To Identify the Clustering Structure)算法,尤其适用于大规模数据集和不同密度的聚类问题。
为了更直观地了解这一点,假设你有以下一组商品的销售数据,希望根据销售额和评分来将它们分组:
商品ID销售额(万元)评分A1104.5A284.7B173.8B263.9C194.0C2114.1通过OPTICS算法可以很容易地将这些商品分为几个不同的组,每个组内的商品都有相似的销售额和评分。
文章目录 OPTICS 密度聚类sklearn 实现