ファイル内のすべてのラテンアルファベットコンポーネントにマークを付けようとしています。例:
This is English. 这是中文。 This is more English.
これは次のようにマークされます:
\english{This is English.} 这是中文。 \english{This is more English.}
私はsed
単語をマークするために使用しようとしました:
sed 's/[A-Za-z0-9 ]*/\\english{&}/g' file
これを実行した後、それはほとんど正しいです、しかし、それはまたすべての漢字の間にマークを置きます、例えば:
\english{This is English.} 这\english{}是\english{}中\english{}文\english{}。 \english{This is more English.}
また、単なるスペースであるが、マークを必要としない場所をマークしています。例:
这是中文。 这也是中文。
これは次のようになります。
这是中文。\english{ }这也是中文。
sed
文字間のスペースをマークしないように、またファイルに'\english{}
を配置しないように、このスクリプトを変更するにはどうすればよいですか?\english{ }