複雜的 UTF-8 世界

昨天一整天在弄 FreeBSD 5.x 上面配合 putty 的 UTF-8 環境，包括了 screen、mutt、vim、irssi、centericq 以及一些台灣常用的套件。(主要是 BBS 的問題)

screen 的問題在 ronnywang 那邊有看到解法：解決用putty看全形字會變一半的問題了!!，其中比較值得慶幸的是新版 putty 已經將 patch import 進去了，不需要在依照原文所寫的方式自己硬幹。不過 screen 還是要自己硬幹，包括改 code 與抓 yjchou 學長所提供的檔案，不過這邊在不斷的 dirty hack 後的代價相當值得，至少上 BBS 完全沒有感覺了。

再來是 irssi 的部分，透過 ports 安裝的版本必須自己去抓 recode.pl 丟進 autorun 的 script directory，不過目前看起來也都還相當正常。

vim 的部分畢竟本來就相當注重 UTF-8 的環境，只要把 termencoding 設成 utf-8 (或 utf8，在 vim 裡都可以用) 就運作的相當正常。

真正的問題在於 centericq 與 mutt 對 UTF-8 計算字寬的問題。

像是 centericq 的畫面就可以發現 Unicode 邊框的問題處理的不太好：

另外 mutt 的畫面也是一樣：

實際算了一下發現都是直接把 UTF-8 word 的長度當作顯示在螢幕上的寬度，於是就…

果然 UTF-8 的世界很複雜啊… :(

9 thoughts on “複雜的 UTF-8 世界”

hi DK , 我也剛好被 utf-8 搞的頭昏啊 :~
想請問你很單純的問題 , 設定好語系之後
如何直接使用 more or less 直接看 utf-8 的檔案咧
最基本的都搞不定很心酸啊 XD

export LANG=zh_TW.UTF-8
export LC_CTYPE=zh_TW.UTF-8
export MM_CHARSET=zh_TW.UTF-8
我的設定 =.=
以前可以用 env LC_CTYPE=en_US.ISO_8859-1 more 檔案看big5 .. 但是有點dirty感 =_=

flickr.com你文章flickr圖的連結都要先經過flash 有點慢
而且圖有可能因為縮圖而看不清楚
怎麼不用這種直接的連結
http://www.flickr.com/photo_zoom.gne?id=13143755&size=o
一些建議…..

我用在 UTF-8 下用 mutt 很正常阿…
會不會是 fbsd 的 mutt 沒有 link 到 ncursesw?

http://wiki.mutt.org/index.cgi?MuttFaq/Charset

===
UTF-8 chars are displayed fine, but the screen is garbled

Mutt has to be linked against a term library with wide char support. For ncurses, this is the libncursesw library.

===

mhsin.orgcsie.ntu.edu.twcsie.ntu.edu.twscreen cjkwidth 的 patch，screen/libiconv 換表在這邊。另外，mutt 比較討厭… 印象中小光光是說如果在 ncurses 裡面打開 wchar support 的話，ncurses 會用 wcwidth 去看字寬，然後再加上小光光的 LC_CTYPE 的 patch ，mutt 應該會比較正常點，另外是可以叫他用 ascii 畫 thread 的線。irssi 的話，0.8.10-rc 已經有內建 recode 而且比 recode.pl 好（這個還要改一兩下），東西在這邊（distfiles 請自己在那個目錄翻，然後請感謝小光光）。

其實討厭的原因都在於字寬啊 …

flickr 的問題請愛用 Firefox + Greasemonkey + Lickr :p

okay, mutt 加上 ascii_chars 有好一點，不過如果標題有中文字還是會爛掉…

mutt 你改用 slang + utf8 patch display 會正常超級多 :p

Pingback: JeffHung.Blog»Blog Archive » 建構 UTF-8 的 UNIX 環境

Pingback: 建構 UTF-8 的 UNIX 環境 [JeffHung.Blog]

Comments are closed.

Gea-Suan Lin's BLOG

複雜的 UTF-8 世界

Related

9 thoughts on “複雜的 UTF-8 世界”

Gea-Suan Lin's technical note and murmuring :)