ずさんに作成されたドキュメントがあります。キリル文字を収録した辞書です。ディクショナリのほとんどは扱いやすいですが、助けが必要なことが 1 つあります。単語にはアクセント付きの文字が含まれており、ほとんどの場合、Unicode アクセント付きの文字として適切にフォーマットされています (したがって、1 つの文字を形成します)。ただし、たとえば a;´ (「a」は任意のキリル文字) のように見える非常に特殊な文字がいくつかあります。その代わりに á が必要です。ただし、これだけを HTML などにエクスポートしてテキスト エディターで操作できれば、それ自体は問題ありません。問題は、Word がこの「もの」を単一の文字/エンティティとして扱い、
- エクスポートするときは完全に省略されます
- コピーすると、メモ帳にのみ貼り付けることができます (3 つの個別の文字に変換されます)。ワードパッドに貼り付けると、まったく表示されません。
- Wordで検索を実行すると、実際の文字も正確にコピー/貼り付けされた組み合わせも、文字が見つかりません。
- ドキュメントがLibre Officeなどの他のソフトウェアで開かれると、手紙は消えます
この時点で、私はしようとしています:
- この組み合わせが正確に何であるかを理解する
- 検索/置換操作を実行して、これらのエラーをすべて見つけて除外します
サンプルの Word ファイルを次に示します。
問題の単語/文字のスクリーンショットは次のとおりです。
正しく入力すると " скре́пка
" のように表示されます。