前言: 在Lucene4.x之后,出现一个重大的特性,就是索引支持DocValues,这对于广大的solr和elasticsearch用户,无疑来说是一个福音,这玩意的出现通过牺牲一定的磁盘空间带来的好处主要有两个: (1)节...
阅读(636) 评论(0)
github地址:https://github.com/qindongliang/hive-solr 欢迎大家fork和使用 关于这个项目的介绍,请参考散仙前面的文章: http://qindongliang.iteye....
阅读(161) 评论(0)
看完这个新闻之后,深表悲痛,心里有一种淡淡的忧伤,可能对这方面了解少的人并不知道,得了肿瘤(癌症)的患者,会是怎样一种生活状态,会面对多大癌细胞和放疗,化疗对人心理,精神,和身体的摧残。 以前总觉得癌症这种病非常神秘和少...
阅读(169) 评论(0)
由于Solr和ElasticSearch都是基于Lucene构建的,所以他们之间有很大程度的相似性,故而他们的一些优化策略基本也是通用的,面对越来越多的海量数据,如何优化全量索引的写入性能呢? 散仙简单总结了下面几个方...
阅读(302) 评论(0)
本篇主要介绍nodejs+redis的使用例子: (一)安装: npm install redis (二)一些比较常使用例子 //建立连接 var redis=require("redis"); va...
阅读(179) 评论(0)
上篇已经介绍了关于Nodejs的背景,优缺点,下载和安装,本篇来看下如何简单的使用nodejs: (1)执行node -h查看nodejs的命令行文档 比较常用的有: node -v 查看版本 node -e  "c...
阅读(157) 评论(0)
(方式一)适合Java调用本地的Liunx无须任何依赖包 /*** * 第一种方法,仅仅执行命令无须关注返回结果 * @throws Exception */ pu...
阅读(277) 评论(0)
(一)什么是nodejs? nodejs是一个是基于Chrome V8(C++编写)的JavaScript引擎,提供了JS运行时的执行环境,这一点有点类似于Java的JVM虚拟机。nodejs是一个事件驱动的,异步非阻塞的i...
阅读(139) 评论(0)
在使用logstash收集日志的时候,我们一般会使用logstash自带的动态索引模板,虽然无须我们做任何定制操作,就能把我们的日志数据推送到elasticsearch索引集群中,但是在我们查询的时候,就会发现,默认的索引模...
阅读(349) 评论(0)
最近有个日志收集监控的项目采用的技术栈是ELK+JAVA+Spring,客户端语言使用的是Java,以后有机会的话可以试一下JavaScript+Nodejs的方式,非常轻量级的组合,只不过不太适合服务化的工程,Kibana...
阅读(398) 评论(0)
在企业级项目开发中,大多数公司都会集成Spring来简化开发成本,要使用Spring自然少不了一大堆需要依赖注入的Bean,通常情况下,我们会选择在spring的xml中,配置一些类的实例,比如连接池,或者配置文件初始化类,...
阅读(292) 评论(0)
数据迁移或备份是任何一个公司都有可能到遇到的一件事,有关hbase数据迁移,官网也给出了几种方案,这里比较推荐使用hadoop distcp这种方式迁移。比较适合大数据量或者跨版本集群之间的数据迁移服务。 版本 Hadoo...
阅读(316) 评论(0)
前言 监控hadoop的框架有不少,如CDH的CM组件和Ambari都可以监控他们自己的hadoop,但是它不能监控apache的hadoop,如果你是使用原生的Apache Hadoop,那么也没关系,原生的Hadoop...
阅读(286) 评论(0)
(一)Hive+Solr简介 Hive作为Hadoop生态系统里面离线的数据仓库,可以非常方便的使用SQL的方式来离线分析海量的历史数据,并根据分析的结果,来干一些其他的事情,如报表统计查询等。 Solr作为高性能的搜索...
阅读(222) 评论(0)
通常,我们的应用系统,如果要做一次全量数据的读取,大多数时候,采用的方式会是使用分页读取的方式,然而 分页读取的方式,在大数据量的情况下,在solr里面表现并不是特别好,因为它随时可能会发生OOM的异常,在solr里面 通...
阅读(278) 评论(0)
上一页 1 2 ... 5 6 7 8 9 10 11 12 ... 下一页共23页  到第