7

249087の重複

ユーザーが生成したアドレスには、分音符号の付いた文字が含まれている可能性があります。そのような文字を最も近い英語の対応する文字に自動的に変換する最も効果的な (つまり一般的な) 方法 (単純な置換を除く) は何ですか?

たとえば、 àâãääåいずれかが

æは 2 つの別個の文字aeになります

çはcになります

èéêëのいずれかがeになる

可能性のあるすべての文字のバリエーションについて (できれば、文字の発音区別記号ごとにルックアップを見つけてエンコードする必要はありません)。

(注: これらのアドレスを、英語以外の文字を印刷できないサード パーティのソフトウェアに渡す必要があります。ソフトウェアでアドレスを処理できればよかったのですが、それを制御することはできません。)

編集: 気にしないでください... [ここ] [2] で答えが見つかりました。投稿後、質問の右側にある「関連」セクションに表示されましたが、以前の検索や投稿前の提案には表示されませんでした。うーん。いずれにせよ、「発音記号」タグを他の質問に追加しました。

編集2:うわあ!私がそれを閉じた後、誰がこれに -1 票を投じましたか?

4

1 に答える 1

1

同じリンクを投稿するつもりでした:-)

すでにこれを行っているようですが、アプリケーションに表示するために元の文字列を保存し、サードパーティのものに対してのみこれを行うことをお勧めします。自分の本当の名前が重要だと思わないと、人は不機嫌になります :-)

于 2008-12-20T04:46:09.417 に答える