 | 让ferret支持中文分词 ... by yadun ... 33 月 28 天前 ... 821 次点击
clsung有篇很好的文章,很简单,
在model里加入以下几句
GENERIC_ANALYSIS_REGEX = /([a-zA-Z]|[\xc0-\xdf][\x80-\xbf])+|[0-9]+|[\xe0-\xef][\x80-\xbf][\x80-\xbf]/
GENERIC_ANALYZER = Ferret::Analysis::RegExpAnalyzer.new(GENERIC_ANALYSIS_REGEX, true)
acts_as_ferret({:fields => [ YOUR FIELDS ] }, { :analyzer => GENERIC_ANALYZER })
我在自己的机器上简单测了一下,中文和英文分词貌似都可行 | |