企業(yè)做網(wǎng)站Lucene的基礎(chǔ)信息
日期 : 2021-01-03 16:55:31
Lucene的基礎(chǔ)信息。Document是Lucene對文檔的抽象, 用于存儲被索引數(shù)據(jù)信息。
搜索引擎的結(jié)果呈現(xiàn)實質(zhì)就是一個Document列表。Field是Document中細(xì)化出來的表示節(jié)點信息的類。在Lucene中用存儲和索引兩個屬性來約束Field, 在實際應(yīng)用中一般用兩個屬性的組合來實現(xiàn)業(yè)務(wù)邏輯。
Term是對現(xiàn)實中詞語的封裝, 是搜索過程中的最小單位, 在term中一般記錄兩類信息, 一類是詞語, 另一類是父節(jié)點信息, 即Field的信息。Lucene把單詞的一次出現(xiàn)定義為Tocken, 其中包含Term的文本信息、起止偏移。
搜索引擎的結(jié)果呈現(xiàn)實質(zhì)就是一個Document列表。Field是Document中細(xì)化出來的表示節(jié)點信息的類。在Lucene中用存儲和索引兩個屬性來約束Field, 在實際應(yīng)用中一般用兩個屬性的組合來實現(xiàn)業(yè)務(wù)邏輯。
Term是對現(xiàn)實中詞語的封裝, 是搜索過程中的最小單位, 在term中一般記錄兩類信息, 一類是詞語, 另一類是父節(jié)點信息, 即Field的信息。Lucene把單詞的一次出現(xiàn)定義為Tocken, 其中包含Term的文本信息、起止偏移。