okwangxing

浏览: 28737 次
性别:
来自: 杭州

博主相关

博客

微博

相册

留言

关于我

文章分类

社区版块

存档分类

Nosql初探(voldemort)

博客分类：

NoSql

NoSQL XML json 数据结构 Google

在这个充斥着无数的nosql的世界,voldemort作为Nosql的一员.简单测试了下'健康状态' background:目前被LinkIn使用，与Dynamo思想类似 1.读写性能. read 10s 100000 writer 15s 1000000 测试机的性能一般,自己开发机器. 2.压缩测试压缩参考数据:10000条真实数据数据量压缩格式时间（毫秒）大小（k）10000 Null 50013 1640410000 Lzf 49451 821210000 Gzip 47764 7184 由于资料很少,对 ...

2010-04-20 22:16
浏览 1756
评论(0)
分类:互联网

MySQL数据库引擎快速指导[转]

博客分类：

MySql

MySQL SQL Web XML Unix

选择你的引擎　　你能用的数据库引擎取决于MySQL在安装的时候是如何被编译的。要添加一个新的引擎，就必须重新编译MySQL。仅仅为了添加一个特性而编译应用程序的概念对于Windows的开发人员来说可能很奇怪，但是在UNIX世界里 ...

2010-03-30 23:22
浏览 954
评论(0)
分类:数据库

Lucene中Boost对文档权重的影响

博客分类：

搜索

lucene Gmail HTML

前提:不对结果做sort操作. 在搜索中,并不是所有的Document和Fields都是平等的.有些技术会要求到对其Doucment或者Fields的权值改变,[b]默认值为:1.0F[b],以上需求都是通过改变Document的boost因子来改变的. setBoost(float) @Test public void testFieldBoost() throws Exception{ String[] email = {"bc_bc@gmail.com","ab_bc@gmail.com","ab_bc_cd@gmail.c ...

2010-02-26 00:11
浏览 4477
评论(0)
分类:企业架构

Lucene之索引建立

博客分类：

搜索

lucene Hibernate Office 搜索引擎数据结构

Lucene可对email,网页,文本资料,doc,pdf之类的文档进行索引建立,在建立索引的时候可为以后的排序做些处理.但运行到分布式的环境中,需要考虑建立索引的性能问题,并发问题,多线程问题,死锁问题,一个Document中包含多个Field. Index的建 ...

2010-02-25 02:25
浏览 2595
评论(4)
分类:企业架构

Lucene之Helloworld

博客分类：

搜索

lucene Apache SVN maven 搜索引擎

Lucene不是一个完整搜索引擎,不具备爬虫功能,管理界面之类的功能,可其部分之项目中实现了网站的搜索引擎,Nutch就是其中的一个,基于Lucene实现的搜索引擎应用. . 本文记录下自己的学习点点滴滴,实现一个简单的程序, Hello world 之实现文本搜索这里没应用中文分词的东西,可以参照庖丁解牛的项目,svn中已经上传了代码,上面有针对lucene3.0的.感兴趣的可自行试验. SVN地址 svn checkout http://paoding.googlecode.com/svn/trunk/ paoding-read-only 项目是利用Maven构建的,自从开始用 ...

2010-02-24 17:22
浏览 1633
评论(3)
分类:企业架构

Zookeeper Java API

博客分类：

分布式

Java Apache Linux

续前话,Zookeeper的环境已经搭建好了.接下来就是利用Java实现与zookeeper的连接,达到和ZOOKEEPER_HOME\bin\zkCli.sh中的部分基础功能. 具体的zookeeper的安装见ZooKeeper起步配置. import java.io.IOException; import java.util.concurrent.CountDownLatch; import org.apache.zookeeper.WatchedEvent; import org.apache.zookeeper.Watcher; import org.apache.zook ...

2010-02-18 22:00
浏览 11297
评论(1)
分类:企业架构

ZooKeeper起步配置

博客分类：

分布式

SSH Java Hadoop vim Ubuntu

0.预备环境 ubuntu9.10 jdk1.6.0_18 Apache hadoop zookeeper 1.JDK安装,开发环境ubuntu9.10,环境变量设置. vim /etc/environment PATH="/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/home/username/software/jdk1.6.0_18/bin" JAVA_HOME="/home/username/software/jdk1.6.0_18" ...

2010-02-15 23:48
浏览 6025
评论(0)
分类:企业架构

最近访客更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Nosql初探(voldemort)

MySQL数据库引擎快速指导[转]

Lucene中Boost对文档权重的影响

Lucene之索引建立

Lucene之Helloworld

Zookeeper Java API

ZooKeeper起步配置

最近访客 更多访客>>

博主相关

文章分类

社区版块

存档分类

最新评论

Nosql初探(voldemort)

MySQL数据库引擎快速指导[转]

Lucene中Boost对文档权重的影响

Lucene之索引建立

Lucene之Helloworld

Zookeeper Java API

ZooKeeper起步配置

最近访客更多访客>>