最近在搞opencv来做一些简单的图像识别,既然涉及到图像识别,那么首先我们要把图像重新认识一下,大部分人看到一张照片可能就是单纯的一张照片,在一些做图像处理的人的眼中,可不就这么简单了。 ### 计算机图形的分类...
阅读(5) 评论(0)
我们知道hbase是一个多版本的管理系统,在0.96的版本之前默认每个列是3个version,在hbase 0.96之后每个列是1个version,所谓的version其实就是同一条数据插入不同的时间戳来实现的,在hbase...
阅读(7) 评论(0)
作为一名有情怀的工程师,一般都会通过博客来记录自己的生活,成长,工作心得或者经验,大部分人使用博客都会经历如下几个阶段: (1)记录在大脑中 (不推荐) (2)使用XXX云笔记 (3)使用iteye,csdn,51ct...
阅读(10) 评论(0)
上篇文章介绍了在es里面批量读取数据的方法mget,本篇我们来看下关于批量写入的方法bulk。 bulk api可以在单个请求中一次执行多个索引或者删除操作,使用这种方式可以极大的提升索引性能。 bulk的语法格式...
阅读(7) 评论(0)
es的api除了提供了基本的curd操作外,还有两个针对批量的操作分别是: 1,批量的读取操作(mget) 2,批量的写入操作(bulk) 本篇文章先介绍mget的用法 Multi Get api 简称(mge...
阅读(8) 评论(0)
我们都知道es是一个分布式的存储和检索系统,在存储的时候默认是根据每条记录的_id字段做路由分发的,这意味着es服务端是准确知道每个document分布在那个shard上的。 相对比于CURD上操作,search一个比较...
阅读(8) 评论(0)
前面的文章提到过es默认的from+size的分页方式返回的结果数据集不能超过1万点,超过之后返回的数据越多性能就越低。 这是因为es要计算相似度排名,需要排序整个整个结果集,假设我们有一个index它有5个shard,...
阅读(10) 评论(0)
在elasticsearch里面给index起一个aliases(别名)能非常优雅的解决两个索引无缝切换的问题,这个功能在某些场景下非常使用。 比如电商的核心商品索引库,除了实时增量数据外,每天都要重建一遍索引,避免in...
阅读(4) 评论(0)
### (一)scroll的介绍 有时候我们可能想要读取整个es索引的数据或者其中的大部分数据,来重建索引或者加工数据,相信大多数人都会说这很简单啊直接用from+size就能搞定,但实际情况是from+size的分页方法...
阅读(7) 评论(0)
作为一个成熟的框架,Elasticsearch里面提供了丰富的操作数据的api,本篇我们就来学习一下在es中更新数据的几种方式。 (一)更新文档 (1)部分更新: java api: ```` `...
阅读(15) 评论(0)
通过前面的文章,我们已经知道在elasticsearch中每个shard每隔1秒都会refresh一次,每次refresh都会生成一个新的segment,按照这个速度过不了多久segment的数量就会爆炸,所以存在太多的...
阅读(12) 评论(0)
通过前面两篇文章的介绍,我们大概已经知道了 Elasticsearch处理数据的流程,其中在Elasticsearch和磁盘之间还有一层称为FileSystem Cache的系统缓存,正是由于这层cache的存在才使得es能...
阅读(17) 评论(0)
上篇文章提到过,在elasticsearch和磁盘之间还有一层cache也就是filesystem cache,大部分新增或者修改,删除的数据都在这层cache中,如果没有flush操作,那么就不能100%保证系统的数据不会...
阅读(10) 评论(0)
上一篇文章中介绍了Elasticsearch中是如何搜索文本的,同时也简述了在es里面索引数据结构的特点不可变性。 索引不可变性的缺点限制了单个索引存储的最大数据量以及更新的频次,所以es面临的问题是如何解决倒排索...
阅读(22) 评论(0)
在分析HashMap和ArrayList的源码时,我们会发现里面存储数据的数组都是用transient关键字修饰的,如下: HashMap里面的: ```` transient Node<K,V>[] t...
阅读(19) 评论(0)
1 2 3 4 5 6 7 8 ... 下一页共22页  到第