上課前繼續虎爛一些外電 :p
Slashdot 上提到了 Microsoft Researcher 在科學美國人 (Scientific American ) 上發表了一篇對 Spam 及 AntiSpam 技術的看法,包括了傳統的 mail spam、IM spam (ICQ/MSN/Yahoo/…)、spam link (指的是在留言板或是類似的地方貼 link,以提高在搜尋引擎的 Rank 或是增加流量,像是 BLOG 常遇到的 comment spam 或 trackback spam)、image spam:Microsoft Researchers on Stopping Spam (Slashdot )、 Stopping Spam (Scientific American ),全文有點長度,不過很值得看一看。
在文章裡用簡單的方式講解許多技術,像是 fingerprinting matching techniques (像是 Nilsimsa Hash,很多 Content-based Spam Filtering 都有用)、n grams model (好像有在哪邊看到,DSpam 好像有在用?)、naive bayesian approach、optical character recognition、challenge/response systems 以及 Human Interacted Proofs。
在 blog2005.twnic.net.tw 的「週刊報導 」有從 e 天下翻拍的資料,三張圖片 (有點大張),Mark & Jedi & Schee 都有接受採訪 :p
Matt 在看到 MT 上的 SpamLookup 後,打算把這些功能在下個版本 implement 出來:Default Spam Handling 。
Feature
SpamLookup Plugin
WordPress Core
IP-based lookup
Yes
No
Domain-based lookup
Yes
No
TrackBack IP check *
Yes
No
Passphrase checks
Yes
No
Checking HTTP Headers
Yes
No
Hyperlink Count limits
Yes
Yes
Dynamic proxy checking
Yes
Yes
Wordlists (blacklist/graylist)
Yes
Yes
Whitelist URL checks
No
Yes
Whitelist Author checks
No
Yes
看起來很完整啊,不知道能不能把 Spam Karma 換掉 :p
ijliao 的這篇「 連戰續任黨主席 ? 」說他看到 Phanix 提到「拱連戰續任黨主席 地方串聯 」裡面這段:
連署書以「連戰先生:請您繼續領導中國國民黨,好嗎?」為題,內容一開始就說,要向連戰說聲對不起,因為有一些話或許不中聽,但是請連戰務必「大人大量」。
完全照在 2/23 寫的「連戰與左冷禪 」一樣:
嵩山派中站出一名瘦削的老者,朗聲說道:「五嶽劍派同氣連枝,聯手結盟,近年來均由左掌門為盟主。左掌門統率五派已久,威望素著,今日五派合併,自然由左盟主為我五嶽派掌門人,若是換作旁人,有誰能服?」
阿斗萬歲!
在 WordPress Hosting Partners 看到這項消息的。
經過上次 WordPress 風暴以後,這次 WordPress 改用其他的方式取得資金:Hosting WordPress 。
這次 WordPress 開了一個目錄 (hosting),列出了幾家便宜的 Web Hosting,以及 promotion link,利用這種方式取得收入。比起上次欺騙 Google 的行為好多了。
OSNews 的 Mozilla: The Honeymoon is over 標題寫得很清楚,當 Firefox 佔有率愈來愈高,他就必須面對現實:一個是 Close Source Software,一個是 Open Source Software,你必須接受在立足點不同的情況下,擁有超越 IE 的安全性。(因為在官方網站上面 “Why Use Firefox?” 其中一條是 “Privacy and Security”)
如果 IE 的程式碼攤開來讓大家檢查,我相信 Firefox 會遠比 IE 安全。
但就現在一個是 Close Source 一個是 Open Source,我不認為 Firefox 的安全性比 IE 高。IE 在 WindowsXP SP2 做得相當好,當出現要安裝奇怪的 ActiveX 時,你不會再不小心誤按 Yes,這點跟 Firefox 的 Install Software 一樣。
就安全性的觀點來看,IE 的安全性是輸在用的人多,而我用 Firefox 是因為用的人少。
聽起來很像「东拉西扯:公车理论与blog 」裡面的公車理論?
不,跟公車理論不一樣:我不會去阻止其他人用 Firefox ,但我不會像某些人大力唾棄 IE 而建議 non-Geeks 使用 Firefox 。
在 Engadget 看到後續的新聞:Wireless USB 1.0 set for May 15 。
我在 Wireless USB 認為 Wireless USB 的主要打擊對象就是權利金過高的 Bluetooth,這點在 Oui-Blog 的「如果說2004是ipod年、那2005將會是Wireless年 」中也有提到。不過 Wireless USB 出來的太晚了,不知道後續的情況是怎麼樣。
可以預測如同當年 USB 的情況,Keyboard & Mouse 這類「耗材」會是最早出 Wireless USB 的一批 (應該在暑假就可以在市面上買到)。
日本的 IBM 與 Sanyo 在研發 Notebook 上使用燃料電池的可行性:IBM Japan And Sanyo, Team Fuel Cell :
IBM Japan and Sanyo are teaming up to bring a real fuel cell system to notebook PCs in the near future.
Sanyo 已經先發展出混和式的電池,包括傳統的鋰電池與燃料電池可以供應 8 小時的電量:
Sanyo has already developed a hybrid battery system with both standard lithium ion battery and fuel cell which can be used on existing ThinkPad models. Said system uses a 130cc cartridge, leading to about 8 hours of battery life.
文中最後說,最值得讚賞的是燃料電池的部分可以 Hot-swapping,但最讓人厭惡的是要 2.2kg XD (比 Notebook 還重…)
原新聞稿在: 三洋電機と日本IBM マイクロ燃料電池を用いた「ノートPC用ハイブリッド電源システム」の実用化に向け協業 (Sanyo )、三洋電機と日本IBM マイクロ燃料電池を用いた 「ノートPC用ハイブリッド電源システム」の実用化に向け協業 (IBM )。
Slashdot 的 People are More Accepting of Spam 提到了:雖然信箱裡的 Mail Spam 愈來愈多,但他們愈來愈不在乎這點。
在原來的新聞 Spam and phishing 裡面提到:
More than a year after the CAN-SPAM Act became law, email users say they are receiving slightly more spam in their inboxes than before, but they are minding it less.
另外一點值得注意的是,收到 Porn Spam 的情況愈來愈少:
Among other things, the survey found that people were getting less porn spam, a uniquely troubling form of spam for most users and particularly for women. While 63% of email users now say they have received porn spam, down 8 percentage points from a year ago, 29% of those email users say they are now getting less porn spam, compared to 16% who said they are getting more.
在還沒開 Greylisting 以前,收到的 spam 數量大約在 300 spam/day 封左右,目前打開後剩下 50 spam/day,其中大部分都被 DSpam 給丟到 Spam Folder 了。
目前有一些新的技術在跑,像是 Yahoo! 在推的 DomainKeys 、Microsoft 與 Pobox 在推的 Sender Policy Framework (雖然我覺得這是一個問題很多的技術),但突破的方法其實也都有,而且都不難。
只要透過 Open Proxy 用 Provider 的 Webmail 硬送就可以了。如果遇到 AuthImage 類 () 的方式,我猜測這些 Spam Software 的發展者會直接把國外論文的成果 import 進去,有九成左右的辨識率。
大家再想想辦法好了…
Posts navigation
Gea-Suan Lin's technical note and murmuring :)