`
okwangxing
  • 浏览: 28737 次
  • 性别: Icon_minigender_1
  • 来自: 杭州
社区版块
存档分类
最新评论
文章列表
在这个充斥着无数的nosql的世界,voldemort作为Nosql的一员.简单测试了下'健康状态' background:目前被LinkIn使用,与Dynamo思想类似 1.读写性能.     read 10s  100000 writer 15s  1000000 测试机的性能一般,自己开发机器. 2.压缩测试 压缩参考数据:10000条真实数据 数据量 压缩格式 时间(毫秒) 大小(k)10000 Null 50013         1640410000 Lzf 49451         821210000 Gzip 47764         7184 由于资料很少,对 ...
选择你的引擎   你能用的数据库引擎取决于MySQL在安装的时候是如何被编译的。要添加一个新的引擎,就必须重新编译MySQL。仅仅为了添加一个特性而编译应用程序的概念对于Windows的开发人员来说可能很奇怪,但是在UNIX世界里 ...
前提:不对结果做sort操作.    在搜索中,并不是所有的Document和Fields都是平等的.有些技术会要求到对其Doucment或者Fields的权值改变,[b]默认值为:1.0F[b],以上需求都是通过改变Document的boost因子来改变的. setBoost(float) @Test public void testFieldBoost() throws Exception{ String[] email = {"bc_bc@gmail.com","ab_bc@gmail.com","ab_bc_cd@gmail.c ...
Lucene可对email,网页,文本资料,doc,pdf之类的文档进行索引建立,在建立索引的时候可为以后的排序做些处理.但运行到分布式的环境中,需要考虑建立索引的性能问题,并发问题,多线程问题,死锁问题,一个Document中包含多个Field. Index的建 ...
Lucene不是一个完整搜索引擎,不具备爬虫功能,管理界面之类的功能,可其部分之项目中实现了网站的搜索引擎,Nutch就是其中的一个,基于Lucene实现的搜索引擎应用.  . 本文记录下自己的学习点点滴滴,实现一个简单的程序, Hello world 之实现文本搜索 这里没应用中文分词的东西,可以参照庖丁解牛的项目,svn中已经上传了代码,上面有针对lucene3.0的.感兴趣的可自行试验. SVN地址 svn checkout http://paoding.googlecode.com/svn/trunk/ paoding-read-only 项目是利用Maven构建的,自从开始用 ...
续前话,Zookeeper的环境已经搭建好了.接下来就是利用Java实现与zookeeper的连接,达到和ZOOKEEPER_HOME\bin\zkCli.sh中的部分基础功能. 具体的zookeeper的安装见ZooKeeper起步配置. import java.io.IOException; import java.util.concurrent.CountDownLatch; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.Watcher; import org.apache.zook ...
0.预备环境 ubuntu9.10 jdk1.6.0_18 Apache hadoop zookeeper 1.JDK安装,开发环境ubuntu9.10,环境变量设置. vim /etc/environment PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/home/username/software/jdk1.6.0_18/bin" JAVA_HOME="/home/username/software/jdk1.6.0_18" ...
Global site tag (gtag.js) - Google Analytics