UTF-8 文字セットに少し問題があります。読み込んで分析したい UTF-8 でエンコードされたファイルがあります。BufferedReader を使用して、ファイルを 1 行ずつ読み取っています。
BufferedReader buffReader = new BufferedReader(new InputStreamReader
(new FileInputStream(file),"UTF-8"));
私の問題は、Java の法線文字列メソッド (trim() と equals() など) が、BufferedReader のすべてのコンテンツを読み取るために作成したループのすべての反復で、BufferReader から読み取られた行で使用するのに適していないことです。 . たとえば、エンコードされたファイルには< menu >
、プログラムにそのまま処理してもらいたいものがありますが、今のところ、?? < m e n u >
他の奇妙な文字が混在しているように見えます。すべての文字セットコード化を削除してプレーンテキストのみを保持する方法があるかどうかを知りたいので、String クラスのすべてのメソッドを複雑にせずに使用できます。ありがとうございました