采用統一編碼UTF-8方式編碼
1- 應用字符集的選擇;所以對提供了多語言版本的網站來說,Unicode字符集應該是最理想的選擇。它是一種雙字節編碼機制的字符集,不管是東方文字還是西方文字,在Unicode中一律用兩個字節來表示,因而至少可以定義65536個不同的字符,幾乎可以涵蓋世界上目前所有通用的語言的每一種字符。 所以在設計和開發多語言網站時,一定要注意先把非中文頁面的字符集定義為“utf-8”格式,即:這一步非常重要,原因在於若等頁面做好之后再更改字符集設置,可說是一件非常非常吃力不討好的工作,有時候甚至可能需要從頭再來,重新輸入網站的文字內容。
2- 語言書寫習慣&導航結構 ;有些國家的語言書寫習慣是從右到左,例如許多中東地區所使用的阿拉伯語,波斯語和希伯來語等等。如果你的市場目標是這些語言的國家,那么在網站設計中就需要考慮這些特殊的語言書寫習慣。而且如果你在網站導航結構設計中使用的是一個豎直導航欄,這時候就應該把它放在右邊,而不是象我們習慣的那樣放在左邊了。
3- 數據庫驅動型網站
對一個數據庫驅動型的網站,尤其是當客戶可以留言並向數據庫添加信息時,則應當考慮如何從技術上實現對不同語言數據信息的收集和檢索。
4- 搜索引擎&市場推廣;最好的辦法是找一個專業的網站推廣公司來幫助進行市場調研。調研內容主要應包括:目標市場國家或地區對什么搜索引擎或門戶網站的使用率最高? 一些主要的門戶網站的用戶真實查詢率又是多少? 這一點尤為重要。就象我們常使用新浪、搜狐等大型國內門戶網站,但一般更多是為了使用其郵件服務。而查詢的話還是喜歡百度或Google一樣,你需要了解在這些人們青睞有加的門戶網站上,到底有多少人是奔查詢而來的。充分的市場考察才能做到有的放矢,從而保證最豐厚的投資回報
多語言網站實現計划 :
1、靜態:就是為每種語言分辨准備一套頁面文件,要么通過文件后綴名來區分不同語言,要么通過子目錄來區分不同語言。
例如對於首頁文件index_en.htm供給英語界面,index_gb.htm供給簡體中文界面,index_big.htm供給繁體中文界面,或者是en/index.htm供給英語界面,gb/index.htm供給簡體中文界面,big/index.htm供給繁體中文界面,一旦用戶選擇了需要的語言后,主動跳轉到相應的頁面,首頁以下其他鏈接也是按照同樣方法處理。從保護的角度來看,通過子目錄比通過文件后綴名來區分不同語言版本顯得要簡略明了。
2,動態:站點內所有頁面文件都是動態頁面文件(PHP,ASP等)而不是靜態頁面文件,在需要輸出語言文字的處所同一采用語言變量來表現,這些語言變量可以根據用戶選擇不同的語言賦予不同的值,從而能夠實現在不同的語言環境下輸出不同的文字。
例如:語言變量ln_name,當用戶選擇的語言是英語時賦值為“Name”,當用戶選擇的語言是簡體中文時賦值為“姓名”,這樣就可以適應不同語言時的輸出。
采用靜態方法的長處是頁面直接輸出到客戶端,不需要在服務器上運行,占用服務器的資源比擬少,系統能夠支撐的並發連接數較多,毛病是要為每種語言制作一套頁面文件,很多內容即使是和語言無關的也要分不同語言來存儲,因此占用的存儲空間較多。
采用動態方法和靜態方法的優毛病正好相反,它的長處是動態頁面文件只有一套,不同語言的文字應用語言變量來存儲,和語言無關的內容只存儲一份,占用的存儲空間較少,並且擴大新語言比擬輕易,毛病需要在服務器上運行,然后把成果輸進到客戶端,占用服務器的資源比擬多,系統能夠支撐的並發連接數較少。
動態數據存貯涉及的一些技巧標題
由於現在網站上動態利用日益增多,相當多的網站還會應用文件或者數據庫來存儲利用信息,因此假如文件或者數據庫中存儲的內容與語言相干時,還需要特別留心。對於存儲在數據庫中信息,可以采用以下幾種方法支撐多語言:
1,在數據庫級別支撐多語言:為每種語言建立獨立的數據庫,不同語言的用戶把持不同的數據庫。
2,在表級別支撐多語言:為每種語言建立獨立的表,不同語言的用戶把持不同的表,但是它們在同一個數據庫中。
3,在字段級別支撐多語言:在同一個表中為每種語言建立獨立的字段,不同語言的用戶把持不同的字段,它們在同一個表中。
由於數據庫中有大批的信息(如標記,編碼,數字等)是用於內部處理應用的,與語言無關的,因此在數據庫級別支撐多語言會導致空間的極大浪費,在字段級別支撐多語言最大的標題是一旦需要支撐新的語言,由於需要修正表結構,保護起來非常麻煩,可擴大性不好。
相比之下,在表級別支撐多語言比擬好,由於並不是所有的表都需要支撐多語言,對於與語言無關的表,不同語言的用戶共用一套,那些和語言相干的表根據支撐語言的種類來建立,不同語言的用戶存取拜訪不同的表格。這樣使得保護簡略,節儉了存儲空間,即使是擴大起來也比擬方便,只要把需要支撐多語言的表,多建立一套即可。
還需要留心的標題是:有些表中某些字段是不同語言版本的表共享的(例如庫存量),由於各種語言的表之間的相對獨立性,使得數據共享有些艱苦。解決的方法有兩個:
1,不同語言的表的共享字段同步:也就是說,只要修正了其中一個表的共享字段,其他語言表中該字段也作相應轉變,實際上當不同語言的用戶同時拜訪時處理還是比擬麻煩的,並且擴充新語言時修正工作比擬大。
2,增加一個新的表:把所有語言共享的字段(例如貨物編號,產地編碼等)全部放在這個表,支撐多語言的表只存放與各種語言相干的字段。不同語言的用戶在應用數據庫時,需要把持兩個數據表。 比擬而言,第二種方法比擬簡略,並且效率比擬高,保護也比擬方便。
