Class HMMChineseTokenizerFactory

Factory for HMMChineseTokenizer

Note: this class will currently emit tokens for punctuation. So you should either add a WordDelimiterFilter after to remove these (with concatenate off), or use the SmartChinese stoplist with a StopFilterFactory via:

words="org/apache/lucene/analysis/cn/smart/stopwords.txt"

This is a Lucene.NET EXPERIMENTAL API, use at your own risk

Inheritance

System.Object

AbstractAnalysisFactory

TokenizerFactory

HMMChineseTokenizerFactory

Inherited Members

TokenizerFactory.ForName(String, IDictionary<String, String>)

TokenizerFactory.LookupClass(String)

TokenizerFactory.AvailableTokenizers

TokenizerFactory.ReloadTokenizers()

TokenizerFactory.Create(TextReader)

AbstractAnalysisFactory.LUCENE_MATCH_VERSION_PARAM

AbstractAnalysisFactory.m_luceneMatchVersion

AbstractAnalysisFactory.OriginalArgs

AbstractAnalysisFactory.AssureMatchVersion()

AbstractAnalysisFactory.LuceneMatchVersion

AbstractAnalysisFactory.Require(IDictionary<String, String>, String)

AbstractAnalysisFactory.Require(IDictionary<String, String>, String, ICollection<String>)

AbstractAnalysisFactory.Require(IDictionary<String, String>, String, ICollection<String>, Boolean)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, String)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, ICollection<String>)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, ICollection<String>, String)

AbstractAnalysisFactory.Get(IDictionary<String, String>, String, ICollection<String>, String, Boolean)

AbstractAnalysisFactory.RequireInt32(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetInt32(IDictionary<String, String>, String, Int32)

AbstractAnalysisFactory.RequireBoolean(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetBoolean(IDictionary<String, String>, String, Boolean)

AbstractAnalysisFactory.RequireSingle(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetSingle(IDictionary<String, String>, String, Single)

AbstractAnalysisFactory.RequireChar(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetChar(IDictionary<String, String>, String, Char)

AbstractAnalysisFactory.GetSet(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetPattern(IDictionary<String, String>, String)

AbstractAnalysisFactory.GetCulture(IDictionary<String, String>, String, CultureInfo)

AbstractAnalysisFactory.GetWordSet(IResourceLoader, String, Boolean)

AbstractAnalysisFactory.GetLines(IResourceLoader, String)

AbstractAnalysisFactory.GetSnowballWordSet(IResourceLoader, String, Boolean)

AbstractAnalysisFactory.SplitFileNames(String)

AbstractAnalysisFactory.GetClassArg()

AbstractAnalysisFactory.IsExplicitLuceneMatchVersion

System.Object.Equals(System.Object)

System.Object.Equals(System.Object, System.Object)

System.Object.GetHashCode()

System.Object.GetType()

System.Object.MemberwiseClone()

System.Object.ReferenceEquals(System.Object, System.Object)

System.Object.ToString()

Namespace: Lucene.Net.Analysis.Cn.Smart

Assembly: Lucene.Net.Analysis.SmartCn.dll

Syntax

public sealed class HMMChineseTokenizerFactory : TokenizerFactory

Constructors

| Improve this Doc View Source

HMMChineseTokenizerFactory(IDictionary<String, String>)

Creates a new HMMChineseTokenizerFactory

Declaration

public HMMChineseTokenizerFactory(IDictionary<string, string> args)

Parameters

Type	Name	Description
System.Collections.Generic.IDictionary<System.String, System.String>	args

Methods

| Improve this Doc View Source

Create(AttributeSource.AttributeFactory, TextReader)

Declaration

public override Tokenizer Create(AttributeSource.AttributeFactory factory, TextReader reader)

Parameters

Type	Name	Description
AttributeSource.AttributeFactory	factory
System.IO.TextReader	reader

Returns

Type	Description
Tokenizer

Overrides

TokenizerFactory.Create(AttributeSource.AttributeFactory, TextReader)