一部の言語のテキストを含む XML ファイルがあります。テキストを 1 つの言語だけで抽出し、別のファイルに保存したいと考えています。これどうやってするの?私のファイルの最初の行の一部を次に示します。
<?xml version="1.0" encoding="UTF-8"?>
<tmx version="1.4b">
<header creationtool="ORESAligner" creationtoolversion="1.0" datatype="plaintext" segtype="paragraph" adminlang="en-us" srclang="EN" o-tmf="ORES"/>
<body>
<tu tuid="55_100:6">
<prop type="session">55</prop>
<prop type="committee">3</prop>
<tuv xml:lang="EN">
<seg>RESOLUTION 55/100</seg>
</tuv>
<tuv xml:lang="AR">
<seg>القرار 55/100</seg>
</tuv>
<tuv xml:lang="ZH">
<seg>第55/100号决议</seg>
</tuv>
<tuv xml:lang="FR">
<seg>RÉSOLUTION 55/100</seg>
</tuv>
<tuv xml:lang="RU">
<seg>РЕЗОЛЮЦИЯ 55/100</seg>
</tuv>
<tuv xml:lang="ES">
<seg>RESOLUCIÓN 55/100</seg>
</tuv>
</tu>
</body>
</tmx>
ここで、英語のテキストだけが必要だとします。目的の出力は次のようになります。
RESOLUTION 55/100
このスクリプトはどのように使用すればよいですか? 私は XML ファイルを操作する初心者であり、この XPath 式をどのように使用すればよいかわかりません。私が知っているように、xmlstarlet は XML ファイルを変更できます。でも方法がわからない…?