DSpam

大致上已經摸熟 DSpam 怎麼用了,接下來是比較細部的 option 可以玩玩看。

目前我把 D2 以及 news.math.nctu.edu.tw 以及 KKcity 都用 DSpam 過濾 Spam,然後看看成果如何。在有 train 過的部分跑的都不錯 (像是我丟了兩千封中文的 Spam 進去學習後,DSpam 對於中文的廣告信判斷的很敏銳),但沒有 train 過的部分漏掉的就很多,尤其是英文的廣告信。

目前是使用 dspam 這隻程式過濾,如果量大的時候可以直接用 C 寫,call C API 直接過濾,會比現在的 fork() + exec() model 再快不少。

而當作 backend db 的是 MySQL 5.0.1-alpha (installed from ports),以 native thread (在 FreeBSD 5.3 上是 KSE),看起來跑的不錯,目前大約有 30 queries/sec (但是看起來很平穩,系統 idle 大約都還有 70%),這大概是 FreeBSD 5-branch 少數可取的地方吧 :p 先這樣跑看看,也許可以找 in2 用 Ptt/Ptt2 的信件一起來操看看這邊的 MySQL performance…

One thought on “DSpam”

  1. Gea-Suan Lin 大大,你好
    我最近在我的FreeBSD上嘗試安裝dspam-3.2.3.20041203.1245 , 在他的 UPDATING 中看到你的大名 , 讓他可以使用MYSQL 50 , 但就如你所說的 , 文件很難看得懂 , 目前我還一直無法正常使用 . 在網路上搜尋的結果 , 大多對這dspam 的誤判率低 , 及執行的速度感到很滿意 …
    不知Gea-Suan Lin大大 什麼時候有空可以把安裝及使用的方法簡單介紹一下?
    謝謝.

Comments are closed.