org.apache.lucene/lucene-analyzers-smartcn/8.2.0

http://lucene.apache.org/lucene-parent/lucene-analyzers-smartcn: Smart Chinese Analyzer (The Apache Software Foundation)

Apache 2

directory

Dependencies

directory

Declarations

org
- apache
  - lucene
    - analysis
      - cn
        
        smart
        
        AnalyzerProfile
        
        ANALYSIS_DATA_DIR: String
        
        static class initializer
        
        init(): void
        
        getAnalysisDataDir(Path): String
        
        CharType
        
        DELIMITER: int
        
        LETTER: int
        
        DIGIT: int
        
        HANZI: int
        
        SPACE_LIKE: int
        
        FULLWIDTH_LETTER: int
        
        FULLWIDTH_DIGIT: int
        
        OTHER: int
        
        SURROGATE: int
        
        HMMChineseTokenizer
        
        sentenceProto: BreakIterator
        
        termAtt: CharTermAttribute
        
        offsetAtt: OffsetAttribute
        
        typeAtt: TypeAttribute
        
        wordSegmenter: WordSegmenter
        
        tokens: Iterator<SegToken>
        
        HMMChineseTokenizer(): void
        
        HMMChineseTokenizer(AttributeFactory): void
        
        setNextSentence(int, int): void
        
        incrementWord(): boolean
        
        reset(): void
        
        HMMChineseTokenizerFactory
        
        HMMChineseTokenizerFactory(Map<String, String>): void
        
        create(AttributeFactory): Tokenizer
        
        SmartChineseAnalyzer
        
        SmartChineseAnalyzer(): void
        
        STOPWORD_FILE_COMMENT: String
        
        stopWords: CharArraySet
        
        DEFAULT_STOPWORD_FILE: String
        
        getDefaultStopSet(): CharArraySet
        
        DefaultSetHolder
        
        DEFAULT_STOP_SET: CharArraySet
        
        static class initializer
        
        loadDefaultStopWordSet(): CharArraySet
        
        SmartChineseAnalyzer(boolean): void
        
        SmartChineseAnalyzer(CharArraySet): void
        
        createComponents(String): TokenStreamComponents
        
        normalize(String, TokenStream): TokenStream
        
        Utility
        
        STRING_CHAR_ARRAY: char[]
        
        NUMBER_CHAR_ARRAY: char[]
        
        START_CHAR_ARRAY: char[]
        
        END_CHAR_ARRAY: char[]
        
        COMMON_DELIMITER: char[]
        
        SPACES: String
        
        MAX_FREQUENCE: int
        
        compareArray(char[], int, char[], int): int
        
        compareArrayByPrefix(char[], int, char[], int): int
        
        getCharType(char): int
        
        WordSegmenter
        
        hhmmSegmenter: HHMMSegmenter
        
        tokenFilter: SegTokenFilter
        
        segmentSentence(String, int): List<SegToken>
        
        convertSegToken(SegToken, String, int): SegToken
        
        WordType
        
        SENTENCE_BEGIN: int
        
        SENTENCE_END: int
        
        CHINESE_WORD: int
        
        STRING: int
        
        NUMBER: int
        
        DELIMITER: int
        
        FULLWIDTH_STRING: int
        
        FULLWIDTH_NUMBER: int
        
        hhmm
        
        AbstractDictionary
        
        GB2312_FIRST_CHAR: int
        
        GB2312_CHAR_NUM: int
        
        CHAR_NUM_IN_FILE: int
        
        getCCByGB2312Id(int): String
        
        getGB2312Id(char): short
        
        hash1(char): long
        
        hash1(char[]): long
        
        hash2(char): int
        
        hash2(char[]): int
        
        BiSegGraph
        
        tokenPairListTable: Map<Integer, ArrayList<SegTokenPair>>
        
        segTokenList: List<SegToken>
        
        bigramDict: BigramDictionary
        
        BiSegGraph(SegGraph): void
        
        generateBiSegGraph(SegGraph): void
        
        isToExist(int): boolean
        
        getToList(int): List<SegTokenPair>
        
        addSegTokenPair(SegTokenPair): void
        
        getToCount(): int
        
        getShortPath(): List<SegToken>
        
        toString(): String
        
        BigramDictionary
        
        BigramDictionary(): void
        
        WORD_SEGMENT_CHAR: char
        
        singleInstance: BigramDictionary
        
        PRIME_BIGRAM_LENGTH: int
        
        bigramHashTable: long[]
        
        frequencyTable: int[]
        
        max: int
        
        repeat: int
        
        getInstance(): BigramDictionary
        
        loadFromObj(Path): boolean
        
        loadFromInputStream(InputStream): void
        
        saveToObj(Path): void
        
        load(): void
        
        load(String): void
        
        loadFromFile(String): void
        
        getAvaliableIndex(long, char[]): int
        
        getBigramItemIndex(char[]): int
        
        getFrequency(char[]): int
        
        HHMMSegmenter
        
        wordDict: WordDictionary
        
        createSegGraph(String): SegGraph
        
        getCharTypes(String): int[]
        
        process(String): List<SegToken>
        
        PathNode
        
        weight: double
        
        preNode: int
        
        compareTo(PathNode): int
        
        hashCode(): int
        
        equals(Object): boolean
        
        SegGraph
        
        tokenListTable: Map<Integer, ArrayList<SegToken>>
        
        maxStart: int
        
        isStartExist(int): boolean
        
        getStartList(int): List<SegToken>
        
        getMaxStart(): int
        
        makeIndex(): List<SegToken>
        
        addToken(SegToken): void
        
        toTokenList(): List<SegToken>
        
        toString(): String
        
        SegToken
        
        charArray: char[]
        
        startOffset: int
        
        endOffset: int
        
        wordType: int
        
        weight: int
        
        index: int
        
        SegToken(char[], int, int, int, int): void
        
        hashCode(): int
        
        equals(Object): boolean
        
        SegTokenFilter
        
        filter(SegToken): SegToken
        
        SegTokenPair
        
        charArray: char[]
        
        from: int
        
        to: int
        
        weight: double
        
        SegTokenPair(char[], int, int, double): void
        
        hashCode(): int
        
        equals(Object): boolean
        
        WordDictionary
        
        WordDictionary(): void
        
        singleInstance: WordDictionary
        
        PRIME_INDEX_LENGTH: int
        
        wordIndexTable: short[]
        
        charIndexTable: char[]
        
        wordItem_charArrayTable: char[][][]
        
        wordItem_frequencyTable: int[][]
        
        getInstance(): WordDictionary
        
        load(String): void
        
        load(): void
        
        loadFromObj(Path): boolean
        
        loadFromObjectInputStream(InputStream): void
        
        saveToObj(Path): void
        
        loadMainDataFromFile(String): int
        
        expandDelimiterData(): void
        
        mergeSameWords(): void
        
        sortEachItems(): void
        
        setTableIndex(char, int): boolean
        
        getAvaliableTableIndex(char): short
        
        getWordItemTableIndex(char): short
        
        findInTable(short, char[]): int
        
        getPrefixMatch(char[]): int
        
        getPrefixMatch(char[], int): int
        
        getFrequency(char[]): int
        
        isEqual(char[], int): boolean

directory

Java files

org/apache/lucene/analysis/cn/smart/

directory

Class files

org/apache/lucene/analysis/cn/smart/