欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

淺談Coreseek、Sphinx-for-chinaese、Sphinx+Scws的區(qū)別

 更新時(shí)間:2016年12月15日 14:48:59   投稿:jingxian  
下面小編就為大家?guī)?lái)一篇淺談Coreseek、Sphinx-for-chinaese、Sphinx+Scws的區(qū)別。小編覺得挺不錯(cuò)的,現(xiàn)在就分享給大家,也給大家做個(gè)參考。一起跟隨小編過(guò)來(lái)看看吧

Sphinx是一個(gè)基于SQL的全文檢索引擎;普遍使用于很多網(wǎng)站

Sphinx的特性如下:

a)  高速的建立索引(在當(dāng)代CPU上,峰值性能可達(dá)到10 MB/秒);

b)  高性能的搜索(在2 – 4GB 的文本數(shù)據(jù)上,平均每次檢索響應(yīng)時(shí)間小于0.1秒);

c)  可處理海量數(shù)據(jù)(目前已知可以處理超過(guò)100 GB的文本數(shù)據(jù), 在單一CPU的系統(tǒng)上可處理100 M 文檔);

Sphinx本身對(duì)中文的支持并不好。

主要體現(xiàn)在對(duì)一段話斷詞;英文只需按照空格對(duì)其分詞即可;但對(duì)于博大精深的中文來(lái)說(shuō),卻是件困難的事情。

分詞在兩個(gè)地方會(huì)用到;

1、索引時(shí),根據(jù)分詞索引原始數(shù)據(jù)

2、搜索時(shí),對(duì)用戶輸入分詞,到索引中查詢

目前最常用的三種方案Coreseek、Sphinx-for-chinaese、Sphinx+Scws

1、Coreseek 為國(guó)人基于Sphinx開發(fā)的方案,目前最穩(wěn)定版,是基于經(jīng)典的Sphinx0.9.9版

優(yōu)點(diǎn):有成熟的文檔、以及社區(qū);其分詞mmseg為目前國(guó)內(nèi)最為好用分詞,索引和搜索分詞都可以用到;

缺點(diǎn):深度開發(fā)、版本更新較慢;索引較慢

策略:一個(gè)詞庫(kù)管理后臺(tái),維護(hù)詞庫(kù);定期生成字典;此套件會(huì)自動(dòng)分詞索引;

適用場(chǎng)景:普通青年、搭建差不多的搜索,適用于普遍網(wǎng)站

2、Sphinx-for-chinaese 為國(guó)人2基于經(jīng)典的Sphinx0.9.9版開發(fā)的擴(kuò)展版

優(yōu)點(diǎn):部署簡(jiǎn)單,易操作,內(nèi)嵌分詞和詞庫(kù),索引和搜索分詞都可以用到;

缺點(diǎn):版本更新較慢;分詞較弱;索引相對(duì)較慢

策略:同一

適用場(chǎng)景:普通青年、快速搭建搜索的小站

3、Sphinx+Scws 為兩套獨(dú)立系統(tǒng),單獨(dú)部署,所謂高內(nèi)聚低耦合,強(qiáng)烈推薦

優(yōu)點(diǎn):兩套系統(tǒng),相對(duì)獨(dú)立,各自單獨(dú)Server;分詞可以做其他用途;版本更新較快;

缺點(diǎn):部署稍復(fù)雜,使用稍復(fù)雜;索引分詞只能用一元分詞,數(shù)據(jù)量較大

策略:詞庫(kù)管理外;使用時(shí),先調(diào)用分詞服務(wù),后調(diào)用搜索

適用場(chǎng)景:文藝青年、搭建像樣點(diǎn)的搜索;好吧文藝青年

以上這篇淺談Coreseek、Sphinx-for-chinaese、Sphinx+Scws的區(qū)別就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • PHP實(shí)現(xiàn)PDO的mysql數(shù)據(jù)庫(kù)操作類

    PHP實(shí)現(xiàn)PDO的mysql數(shù)據(jù)庫(kù)操作類

    這篇文章主要介紹了PHP實(shí)現(xiàn)PDO的mysql數(shù)據(jù)庫(kù)操作類,其中dbconfig類負(fù)責(zé)配置數(shù)據(jù)庫(kù)訪問(wèn)信息,dbtemplate類集合了對(duì)數(shù)據(jù)庫(kù)的訪問(wèn)操作,非常具有實(shí)用價(jià)值,需要的朋友可以參考下
    2014-12-12
  • 解析php mysql 事務(wù)處理回滾操作(附實(shí)例)

    解析php mysql 事務(wù)處理回滾操作(附實(shí)例)

    其實(shí)用PHP來(lái)處理mysql的事務(wù)回滾并不難,下面小編就詳細(xì)的為大家介紹一下。相信大家看完之后都知道如何使用
    2013-08-08
  • PHP5中使用PDO連接數(shù)據(jù)庫(kù)的方法

    PHP5中使用PDO連接數(shù)據(jù)庫(kù)的方法

    PDO(PHP Data Object) 是PHP 5 中加入的東西,是PHP 5新加入的一個(gè)重大功能,因?yàn)樵赑HP 5以前的php4/php3都是一堆的數(shù)據(jù)庫(kù)擴(kuò)展來(lái)跟各個(gè)數(shù)據(jù)庫(kù)的連接和處理,什么 php_mysql.dll、php_pgsql.dll、php_mssql.dll、php_sqlite.dll等等。
    2010-08-08
  • php表單提交與$_POST實(shí)例分析

    php表單提交與$_POST實(shí)例分析

    這篇文章主要介紹了php表單提交與$_POST,實(shí)例分析了表單提交中$_POST變量的具體內(nèi)容形式,有助于更好的掌握表單提交中的數(shù)據(jù)操作技巧,需要的朋友可以參考下
    2015-01-01
  • PHP實(shí)現(xiàn)簡(jiǎn)單的協(xié)程任務(wù)調(diào)度demo示例

    PHP實(shí)現(xiàn)簡(jiǎn)單的協(xié)程任務(wù)調(diào)度demo示例

    這篇文章主要介紹了PHP實(shí)現(xiàn)簡(jiǎn)單的協(xié)程任務(wù)調(diào)度demo,結(jié)合實(shí)例形式詳細(xì)分析了PHP基于協(xié)程的任務(wù)調(diào)度基本原理、定義及使用技巧,需要的朋友可以參考下
    2020-02-02
  • php中FTP函數(shù)ftp_connect、ftp_login與ftp_chmod用法

    php中FTP函數(shù)ftp_connect、ftp_login與ftp_chmod用法

    這篇文章主要介紹了php中FTP函數(shù)ftp_connect、ftp_login與ftp_chmod用法,詳細(xì)講述了PHP的FTP操作技巧,并以實(shí)例形式對(duì)ftp_connect、ftp_login與ftp_chmod的用法進(jìn)行了總結(jié),需要的朋友可以參考下
    2014-11-11
  • PHP函數(shù)積累總結(jié)

    PHP函數(shù)積累總結(jié)

    這篇文章主要介紹了PHP函數(shù)積累,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
    2019-03-03
  • PHP5.2下preg_replace函數(shù)的問(wèn)題

    PHP5.2下preg_replace函數(shù)的問(wèn)題

    這篇文章主要介紹了PHP5.2下preg_replace函數(shù)的問(wèn)題,需要的朋友可以參考下
    2015-05-05
  • php提示undefined index的幾種解決方法

    php提示undefined index的幾種解決方法

    雖然可以通過(guò)設(shè)置錯(cuò)誤顯示方式來(lái)隱藏這個(gè)提示,但是這樣也有隱患,就是在服務(wù)器的日志中會(huì)記錄這些提示,導(dǎo)致日志文件異常龐大
    2012-05-05
  • PHP實(shí)現(xiàn)實(shí)時(shí)生成并下載超大數(shù)據(jù)量的EXCEL文件詳解

    PHP實(shí)現(xiàn)實(shí)時(shí)生成并下載超大數(shù)據(jù)量的EXCEL文件詳解

    EXCEL文件的處理是我們?cè)谌粘9ぷ髦薪?jīng)常會(huì)遇到的,這篇文章主要給大家介紹了關(guān)于利用PHP如何實(shí)現(xiàn)實(shí)時(shí)生成并下載超大數(shù)據(jù)量的EXCEL文件,通過(guò)文中介紹的這個(gè)方法對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考借鑒,下面來(lái)一起看看吧。
    2017-10-10

最新評(píng)論