網站seo優化索引的建立
日期 : 2021-01-03 17:00:53
索引的建立。索引建立時, 使用的是Lucene的索引器Index Writer類。對Index Writer類所使用的語言分析器進行修改, 使其支持中文分詞。
這里采用了簡單的單漢字切分, 即將單個漢字作為一個術語, 利用Java CC編程實現。并且在生成索引器將支持中文單漢字切分的語言分析器作為參數傳遞給索引器成為索引器的成員, 使其在索引過程中使用該語言分析器進行分詞。
最后, 調用Index Write類的add Document () , 將網絡爬蟲抓取且轉換為Document格式的文件, 根據字段類型進行分別處理, 加入到索引字段。
這里采用了簡單的單漢字切分, 即將單個漢字作為一個術語, 利用Java CC編程實現。并且在生成索引器將支持中文單漢字切分的語言分析器作為參數傳遞給索引器成為索引器的成員, 使其在索引過程中使用該語言分析器進行分詞。
最后, 調用Index Write類的add Document () , 將網絡爬蟲抓取且轉換為Document格式的文件, 根據字段類型進行分別處理, 加入到索引字段。
上一篇:網站seo優化創建索引
下一篇:網站seo優化字號大小