Class RussianAnalyzer

Lucene.Net.Analysis.Analyzer for Russian language.

Supports an external list of stopwords (words that will not be indexed at all). A default set of stopwords is used unless an alternative list is specified.

You must specify the required Lucene.Net.Util.LuceneVersion compatibility when creating RussianAnalyzer:

As of 3.1, StandardTokenizer is used, Snowball stemming is done with SnowballFilter, and Snowball stopwords are used by default.

Inheritance

object

Analyzer

StopwordAnalyzerBase

RussianAnalyzer

Implements

IDisposable

Inherited Members

StopwordAnalyzerBase.StopwordSet

Analyzer.NewAnonymous(Func<string, TextReader, TokenStreamComponents>)

Analyzer.NewAnonymous(Func<string, TextReader, TokenStreamComponents>, ReuseStrategy)

Analyzer.NewAnonymous(Func<string, TextReader, TokenStreamComponents>, Func<string, TextReader, TextReader>)

Analyzer.NewAnonymous(Func<string, TextReader, TokenStreamComponents>, Func<string, TextReader, TextReader>, ReuseStrategy)

Analyzer.GetTokenStream(string, TextReader)

Analyzer.GetTokenStream(string, string)

Analyzer.GetPositionIncrementGap(string)

Analyzer.GetOffsetGap(string)

Analyzer.Strategy

Analyzer.Dispose()

Analyzer.GLOBAL_REUSE_STRATEGY

Analyzer.PER_FIELD_REUSE_STRATEGY

object.Equals(object)

object.Equals(object, object)

object.GetHashCode()

object.GetType()

object.ReferenceEquals(object, object)

object.ToString()

Namespace: Lucene.Net.Analysis.Ru

Assembly: Lucene.Net.Analysis.Common.dll

Syntax

public sealed class RussianAnalyzer : StopwordAnalyzerBase, IDisposable

Constructors

RussianAnalyzer(LuceneVersion)

Lucene.Net.Analysis.Analyzer for Russian language.

Supports an external list of stopwords (words that will not be indexed at all). A default set of stopwords is used unless an alternative list is specified.

You must specify the required Lucene.Net.Util.LuceneVersion compatibility when creating RussianAnalyzer:

As of 3.1, StandardTokenizer is used, Snowball stemming is done with SnowballFilter, and Snowball stopwords are used by default.

Declaration

public RussianAnalyzer(LuceneVersion matchVersion)

Parameters

Type	Name	Description
LuceneVersion	matchVersion

RussianAnalyzer(LuceneVersion, CharArraySet)

Builds an analyzer with the given stop words

Declaration

public RussianAnalyzer(LuceneVersion matchVersion, CharArraySet stopwords)

Parameters

Type	Name	Description
LuceneVersion	matchVersion	lucene compatibility version
CharArraySet	stopwords	a stopword set

RussianAnalyzer(LuceneVersion, CharArraySet, CharArraySet)

Builds an analyzer with the given stop words

Declaration

public RussianAnalyzer(LuceneVersion matchVersion, CharArraySet stopwords, CharArraySet stemExclusionSet)

Parameters

Type	Name	Description
LuceneVersion	matchVersion	lucene compatibility version
CharArraySet	stopwords	a stopword set
CharArraySet	stemExclusionSet	a set of words not to be stemmed

Fields

DEFAULT_STOPWORD_FILE

File containing default Russian stopwords.

Declaration

public const string DEFAULT_STOPWORD_FILE = "russian_stop.txt"

Field Value

Type	Description
string

Properties

DefaultStopSet

Returns an unmodifiable instance of the default stop-words set.

Declaration

public static CharArraySet DefaultStopSet { get; }

Property Value

Type	Description
CharArraySet	an unmodifiable instance of the default stop-words set.

Methods

CreateComponents(string, TextReader)

Creates Lucene.Net.Analysis.TokenStreamComponents used to tokenize all the text in the provided TextReader.

Declaration

protected override TokenStreamComponents CreateComponents(string fieldName, TextReader reader)

Parameters

Type	Name	Description
string	fieldName
TextReader	reader

Returns

Type	Description
TokenStreamComponents	Lucene.Net.Analysis.TokenStreamComponents built from a StandardTokenizer filtered with StandardFilter, LowerCaseFilter, StopFilter , SetKeywordMarkerFilter if a stem exclusion set is provided, and SnowballFilter

Overrides

Analyzer.CreateComponents(string, TextReader)

Implements

IDisposable