利用MS-Word讀取非UTF-8/BIG5編碼的文件

最近翻出多年前的《文明3》遊戲打發時間,其中建立的城市名稱可以更改,但遇到Windows7/XP這種以Unicode為預設編碼的作業系統,鍵盤輸入的中文字進入遊戲內部後,往往會成為亂碼或錯字。根據經驗,此類遊戲多半是採用BUG-5編碼的native 950 code page來設計,因為BIG-5取字較少,所以顯示時沒有問題,但輸入時便無法對應。

閒得無聊,打開遊戲安裝目錄來檢視,訝然地發現兩點:

1. Windows 7遇到非完全相容的安裝時,會將一些目錄位置自動導引至使用者文件路徑。譬如說,《文明3》的遊戲儲存位置原本預設是在C:\Program Files\Civilization III\Saves,Windows7基於安全性,會將這類應用程式儲存目錄改至C:\Users\[User Account]\AppData\Local\VirtualStore\Program Files\[Application]以下的相對路徑去。

2. 《文明3》的一些文字格式設定檔案,竟然是用GB2312簡體中文編碼來儲存,然後到了遊戲內部再轉碼成BIG-5顯示。要開啟此類native code編碼的文件,最簡便的方式就是利用MS-Word來開啟,MS-Word遇到非unicode或預設語系的文件,會出現提示對話框來詢問該文件的編碼方式,而且選擇後可以即時預覽編碼方式是否正確。

結論:時代進步,早期全球各地資訊界各自發展所以有編碼差異的問題,演進至現在才因著微軟作業系統的獨領風騷而驅動地域差異統一。雖說微軟不免予人霸悍的觀感,但對於資訊發展的貢獻,吾輩倒也不可忽視。

Re:利用MS-Word讀取非UTF-8/BIG5編碼的文件

hoja | 2010-02-07 12:04:56

OpenOffice 早就這樣做了...

回應留言

姓名:
Email:
網站:
標題:
為了防止垃圾留言,請動動腦筋計算一下:
九加上六等於多少? (阿拉伯數字)
Menu_home
Menu_mobile
Menu_category
Menu_label
Menu_calendar
Menu_rss
木由子的咆笑日記