摘要:本文对Apriori算法进行了简单介绍,并通过Python进行实现,进而结合UCI数据库中的肋形蘑菇数据集对算法进行验证。   “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人...
阅读(71) 评论(0)
摘要:本文分别介绍了线性回归、局部加权回归和岭回归,并使用python进行了简单实现。   在这之前,已经学习过了Logistic回归,今天继续看回归。首先说一下回归的由来:回归是由达尔文的表兄弟Francis Galton发明的...
阅读(62) 评论(0)
参加完数模之后休息了几天,今天继续看TF-IDF算法。上篇中对TF-IDF算法已经做了详细的介绍,在此不再赘述。今天主要是通过python,结合sklearn库实现该算法,并通过k-means算法实现简单的文档聚类。 一 结巴分词...
阅读(66) 评论(0)
    假设现在有一篇很长的文章,要从中提取出它的关键字,完全不人工干预,那么怎么做到呢?又有如如何判断两篇文章的相似性的这类问题,这是在数据挖掘,信息检索中经常遇到的问题,然而TF-IDF算法就可以解决。这两天因为要用到这...
阅读(63) 评论(0)
最近一直在看机器学习相关的算法,今天学习logistic回归,在对算法进行了简单分析编程实现之后,通过实例进行验证。 一 logistic概述             &...
阅读(69) 评论(0)