1

少し難しくなりますが、問題を説明してみます。

座標を含む特定のページからいくつかの情報を解析しようとしています。コピーペーストすると、次のようになります。

距離 位置
5.8 (77|-2) <br> 6.3 (76|-1) <br> 7.8 ( 76|6) <br> 9.2 (91|3) <br> 9.5 (79| 10) <br> 12.2 (80|13) <br> 15 (82|-14) < br> 15 (81|16)

今私が抱えている問題は、「(」と数字の間に不明な文字があることです。右矢印キーを押しても移動しませんが、数回押すと移動します。

私はこのことをどこにも遭遇していません。それが役立つ場合、ウェブサイトはphpにあります。また、ここに情報をコピーして貼り付けるときに役立つ場合は、文字が消え、テキスト内を自由に移動できます。

座標を int に解析しようとしているためにソフトウェアが誤動作する原因となっているため、この問題を解決してください。その文字のために、フォーマット例外が発生します。

4

1 に答える 1

2

UTF-8 で表示している間は何も表示されませんが、エンコーディングを ANSI に変更すると、次のようになります。

5.8 ‎‭(‭‭77‬‬|‭-‭2‬‬)‬‎
6.3 ‎‭(‭‭76‬‬|‭-‭1‬‬)‬‎
7.8 ‎‭(‭‭76‬‬|‭‭6‬‬)‬‎
9.2 ‎‭(‭‭91‬‬|‭‭3‬‬)‬‎
9.5 ‎‭(‭‭79‬‬|‭‭10‬‬)‬‎
12.2 ‎‭(‭‭80‬‬|‭‭13‬‬)‬‎
15 ‎‭(‭‭82‬‬|‭-‭14‬‬)‬‎
15 ‎‭(‭‭81‬‬|‭‭16‬‬)‬‎

左から右へのマーク(‎â€)を使用しているようで、エンコーディングが 1 つか 2 回入れ替わっています。

ウェブサイトからのものなので、きれいにすることができます。私の最初の推測は、ブラウザの設定が正しくない (エンコーディング セットが間違っている) ことです。

あなたはまだそれをきれいにすることを試みることができます.

コード:

Regex rgx = new Regex("[^a-zA-Z0-9_\n %\[\]\.\(\)%&-]");
data = rgx.Replace(data, "");
于 2013-08-06T18:19:00.040 に答える