Nexus Weblogging
ChinaonRails
You are here ChinaonRails > Ruby on Rails > 插件 > 让ferret支持中文分词

yadun


0.370%

disconnected
登录后回复主题 | 跳到回复(1)

让ferret支持中文分词

... by yadun ... 39 月 20 天前 ... 848 次点击

clsung有篇很好的文章,很简单,
在model里加入以下几句
GENERIC_ANALYSIS_REGEX = /([a-zA-Z]|[\xc0-\xdf][\x80-\xbf])+|[0-9]+|[\xe0-\xef][\x80-\xbf][\x80-\xbf]/
GENERIC_ANALYZER = Ferret::Analysis::RegExpAnalyzer.new(GENERIC_ANALYSIS_REGEX, true)
acts_as_ferret({:fields => [ YOUR FIELDS ] }, { :analyzer => GENERIC_ANALYZER })
我在自己的机器上简单测了一下,中文和英文分词貌似都可行


1 - 2007-6-1 9:13
derk 广州
3x
看完之后有话想说?那就帮楼主加盖一层吧!

在回复之前你需要先进行登录
电子邮件或昵称
密码
当前热门主题  野心勃勃的用“饭桶”来部署git ... 34 篇回复
© 2006-2010 A Jesse Cai Production   -   About   -   京ICP备07020911号
a site powered by Project Babel