TMX で多言語をサポートするアプリケーションを構築しています。Windows 用のエディターをいくつか見つけましたが、リモート サーバーで開発しているため、文字列を変換して TMX ファイルに書き込むための Linux 用のコマンド ライン ツールを探しています。そのようなツールを知っている人はいますか?
3 に答える
TMX、(Translation Memory eXchange)形式は単純なXMLファイルです。正確な仕様は、http ://www.lisa.org/Translation-Memory-e.34.0.html#c33にあります。
そこには検証ツールもあります。
お気づきのように、TMX形式にはいくつかのバージョンがあります。フォーマット情報を気にしないと仮定すると、最も古いフォーマットが最も広くサポートされています。
TMXコードの例を次に示します。
<body>
<tu creationdate="20080317T093024Z" creationid="user_name">
<tuv xml:lang="EN-US">
<seg>English text</seg>
</tuv>
<tuv xml:lang="FR-FR">
<seg>French text</seg>
</tuv>
...
</tu>
</body>
OmegaT(Java)やOkapi Framework(Java&.NET)など、TMXをサポートするオープンソースプロジェクトがいくつかありますが、率直に言って、TMXを直接出力する方が簡単でしょう。
つまり、ツールに関係なく、ソースとターゲットの言語コードを指定する必要があります(警告:これはTMXツール間の互換性の問題の最大の原因です。受け入れるものに寛大です...)。言語文字列を出力し、それらがどの言語であるかを指定します。
したがって、文字列をXMLタグでラップし、タイムスタンプをたたくだけで完了です。
bitext2tmx、多分?これはJavaで記述されており、Linuxで正常に動作します。2つのプレーンテキストファイルのデータをマージします。試したことはありませんが、編集機能は問題ないようです。
TMX のウィキペディアのページでpo2tmxを見つけました
サンプルの.poファイルを追加するために編集.poファイル
のフォーマット:
msgid "This is my first string"
msgstr "This is my first string"
msgid "This is my second string"
msgstr "This is my second string"