Python2.5之后引入了上下文管理器(context manager),算是Python的黑魔法之一,它用于规定某个对象的使用范围。本文是针对于该功能的思考总结。 为什么需要上下文管理器? 首先,需要思索下为什么需要引入上下文管...
阅读(11) 评论(0)
本文将介绍使用Python编写多线程HTTP下载器,并生成.exe可执行文件。 环境:windows/Linux + Python2.7.x 单线程 在介绍多线程之前首先介绍单线程。编写单线程的思路为:  解析url; 连接...
阅读(50) 评论(0)
最近写了一个爬虫,想对它优化一下,就想到了可以使用scrapy + redis实现一个分布式爬虫,今天就学习学习redis。 一 Redis简介 redis是一个高性能的key-value数据库,它是将数据存储在内存当中,因此相对而...
阅读(845) 评论(0)
爬虫真是一件有意思的事儿啊,之前写过爬虫,用的是urllib2、BeautifulSoup实现简单爬虫,scrapy也有实现过。最近想更好的学习爬虫,那么就尽可能的做记录吧。这篇博客就我今天的一个学习过程写写吧。 一  ...
阅读(209) 评论(0)
摘要: 本文是使用Python,结合Tkinter开发简单记事本。   本文的操作环境:ubuntu,Python2.7,采用的是Pycharm进行代码编辑,个人很喜欢它的代码自动补齐功能。   最近很想对python加深学习一下...
阅读(83) 评论(0)
前几天在网上看到了篇采用Django搭建简易博客的视频,好奇心驱使也就点进去学了下,毕竟自己对于Django是无比敬畏的,并不是很了解,来次初体验。   本文的操作环境:ubuntu、python2.7、Django1.8.6、P...
阅读(150) 评论(0)
摘要:   对Nim Game、WordPattern、Move zeros、First Bad version、Ugly Number五个算法的python实现。     一个月多没更新,大概是因为状态一直不太好吧,有几次打开却...
阅读(92) 评论(0)
本来老师是想让我学Hadoop的,也装了Ubuntu,配置了Hadoop,一时间却不知从何学起,加之自己还是想先看点自己喜欢的算法,学习Hadoop也就暂且搁置了,不过还是想问一下园子里的朋友有什么学习Hadoop好点的资料,求推荐...
阅读(139) 评论(0)
摘要:本文对Apriori算法进行了简单介绍,并通过Python进行实现,进而结合UCI数据库中的肋形蘑菇数据集对算法进行验证。   “啤酒与尿布”的例子相信很多人都听说过吧,故事是这样的:在一家超市中,人...
阅读(120) 评论(0)
摘要:本文分别介绍了线性回归、局部加权回归和岭回归,并使用python进行了简单实现。   在这之前,已经学习过了Logistic回归,今天继续看回归。首先说一下回归的由来:回归是由达尔文的表兄弟Francis Galton发明的...
阅读(101) 评论(0)
参加完数模之后休息了几天,今天继续看TF-IDF算法。上篇中对TF-IDF算法已经做了详细的介绍,在此不再赘述。今天主要是通过python,结合sklearn库实现该算法,并通过k-means算法实现简单的文档聚类。 一 结巴分词...
阅读(105) 评论(0)
    假设现在有一篇很长的文章,要从中提取出它的关键字,完全不人工干预,那么怎么做到呢?又有如如何判断两篇文章的相似性的这类问题,这是在数据挖掘,信息检索中经常遇到的问题,然而TF-IDF算法就可以解决。这两天因为要用到这...
阅读(105) 评论(0)
最近一直在看机器学习相关的算法,今天学习logistic回归,在对算法进行了简单分析编程实现之后,通过实例进行验证。 一 logistic概述             &...
阅读(113) 评论(0)
摘要:   针对于单一核在处理多数据源和异构数据源方面的不足,多核方法应运而生。本文是将多核方法应用于FCM算法,并对算法做以详细介绍,进而采用MATLAB实现。     在这之前,我们已成功将核方法应用于FCM算法,在...
阅读(185) 评论(0)
摘要:   本文主要针对于FCM算法在很大程度上局限于处理球星星团数据的不足,引入了核方法对算法进行优化。    与许多聚类算法一样,FCM选择欧氏距离作为样本点与相应聚类中心之间的非相似性指标,致使算法趋向于发...
阅读(84) 评论(0)
1 2 下一页共2页  到第