- 本文地址: https://www.laruence.com/2009/07/19/1003.html
- 转载请注明出处
开发多语言的Web应用是一件非常困难的事,各个国家的字符集的编码方式、货币符号、日期格式、数字格式、文字表现都各不相同.
我们今天用一个简单的实例说明一下在PHP中的getText的用法(getText是一系列的工具和库函数,帮助程序员和翻译人员开发多语言软件的), 从而实现PHP的i18n.
现在, 我们假设要显示一个返回主页的link:
//home.php: $str = 'home'; print <<<html <a href="#">{$str}</a> HTML;
下面开启我们多语言的开发之旅:
创建pot文件,pot是Portable Object Template的首字母缩写,与po对应的是mo,mo是Machine Object的首字母缩写。前者意指原始的字符串文件,一般用于给翻译人员去修改的,后者则是与机器相关的,一般是供程序读取。可以手工创建pot文件,也可以通过xgettext从代码中抽取字符串来产生。这里是用xgettext来产生的:
xgettext -a home.php -o home.pot
运行该命令后,我们发现,在当前目录下,产生了一个名home.pot的文件,打开该文件,可以看到:
# SOME DESCRIPTIVE TITLE. # Copyright (C) YEAR THE PACKAGE'S COPYRIGHT HOLDER # This file is distributed under the same license as the PACKAGE package. # FIRST AUTHOR <email@ADDRESS>, YEAR. # #, fuzzy msgid "" msgstr "" "Project-Id-Version: PACKAGE VERSION\n" "Report-Msgid-Bugs-To: \n" "POT-Creation-Date: 2009-07-23 20:56+0800\n" "PO-Revision-Date: YEAR-MO-DA HO:MI+ZONE\n" "Last-Translator: FULL NAME <email@ADDRESS>\n" "Language-Team: LANGUAGE <ll@li.org>\n" "MIME-Version: 1.0\n" "Content-Type: text/plain; charset=CHARSET\n" "Content-Transfer-Encoding: 8bit\n" #: home.php:2 msgid "home" msgstr ""
根据pot产生不同语言的po文件,这里我们先产生一个简体中文的po文件:
export LANG=zh_CN.gb2312
msginit -l zh_CN.gb2312 -i home.pot
运行该命令后,我们发现,在当前目录下,产生了一个名zh_CN.po的文件,打开该文件,可以看到:
# Chinese translations for PACKAGE package # PACKAGE 软件包的简体中文翻译. # Copyright (C) 2009 THE PACKAGE'S COPYRIGHT HOLDER # This file is distributed under the same license as the PACKAGE package. # <huixinchen@localhost.localdomain>, 2009. # msgid "" msgstr "" "Project-Id-Version: PACKAGE VERSION\n" "Report-Msgid-Bugs-To: \n" "POT-Creation-Date: 2009-07-23 20:56+0800\n" "PO-Revision-Date: 2009-07-23 21:00+0800\n" "Last-Translator: FULL NAME <email@ADDRESS>\n" "Language-Team: Chinese\n" "MIME-Version: 1.0\n" "Content-Type: text/plain; charset=GB2312\n" "Content-Transfer-Encoding: 8bit\n" #: test.php:2 msgid "home" msgstr ""
翻译zh_CN.po里对应的字符串为中文:
# Chinese translations for PACKAGE package # PACKAGE 软件包的简体中文翻译. # Copyright (C) 2009 THE PACKAGE'S COPYRIGHT HOLDER # This file is distributed under the same license as the PACKAGE package. # <huixinchen@localhost.localdomain>, 2009. # msgid "" msgstr "" "Project-Id-Version: PACKAGE VERSION\n" "Report-Msgid-Bugs-To: \n" "POT-Creation-Date: 2009-07-23 20:56+0800\n" "PO-Revision-Date: 2009-07-23 21:00+0800\n" "Last-Translator: <huixinchen@localhost.localdomain>\n" "Language-Team: Chinese\n" "MIME-Version: 1.0\n" "Content-Type: text/plain; charset=GB2312\n" "Content-Transfer-Encoding: 8bit\n" #: test.php:2 msgid "home" msgstr "主页"
根据po文件生成mo文件。
msgfmt zh_CN.po -o zh_CN.mo
运行该命令后,我们发现,在当前目录下,产生了一个名zh_CN.mo的文件。它是二进制的,不能用文本编辑器打开。
安装mo文件到特定目录中:
cp -f zh_CN.mo .local/LC_MESSAGES/home.mo
修改程序。
setlocale(LC_ALL, 'zh_CN'); // Specify location of translation tables bindtextdomain("home", "."); // Choose domain textdomain("home"); // Translation is looking for in ./locale/zh_CN/LC_MESSAGES/home.mo now $str = gettext('home'); //也可以使用_('home') print <<<html <a href="#">{$str}</a> HTML;
运行这个脚本, 看看, 是不是输出正确的中文了呢?
添加其它语言也很容易,不需要修改程序,只需要像对待中文一样,生成一个mo文件,并安装到系统中对应的目录即可。切换不同的语言仅仅是修改当前的locale就行了。
ltobet
Good I appreciated your work very thanks
very good post, thank you for sharing useful information, keep posting.
我进行了一下对比测试,使用gettext函数进行语言转换和使用数组进行替换,数组要快一点,不知道是不是因为函数调用跟二进制文件内查找的消耗要大些造成的。更关键的问题是,gettext一般是用一个mo文件,体积可能会比较大,而数组一般会使用多个文件,文件数量又可能太多。
Thefe is definbately a great deal to learn about thhis topic.
I like alll of the popints you haqve made.
Loook aat my webskte … newss (Bud)
有个问题,用中文做msgid,其它语言做msgstr,在运行时,会出现页面上一部分中文,一部分英文的情况.
还有,如果页面上有iframe,有时会出现主页面语言正常,iframe里则是中文的问题。
这种情况是怎么回事?
试验成功!多谢,鸟哥
我使用msginit生成出来的文件,并没有自动帮我翻译,什么情况呢?
windows下用不起。。。
$locale = ‘zh_CN.utf8’;//windows上没有?
putenv(“LANGUAGE=$locale”);返回 false
putenv(‘LANGUAGE=’.$locale);也没起作用
在win下尝试了下,每次修改mo文件以后都需要重启apache才成生效。
getext是以php扩展的形式存在, 应该比使用纯php性能要高
[…] 本文地址: http://www.laruence.com/2009/07/19/1003.html […]
getText是一个很不错的东西,Wordpress博客程序中也是用mo做多语言,但使用过程中感觉性能很差。
所以想请教如果mo做多语言包会不会有性能上的问题呢?