PDFに含まれるすべてのテキストを抽出してデータベースに保存するC#アプリケーションを作成しました。
私が抱えている問題は、保存された情報を再利用して、XML を使用して Web サイトに表示する場合です。無効な文字 0x0000 のようなエラーが表示されます。私が読んだところによると、0x0000 文字は XML では許可されていません。
だから、私の質問は; データベースに保存する前に、タイプ 0x0000 のすべての文字を C# で削除する方法を知っている人はいますか?
置換を使用してはどうですか
現在の文字列内の指定された Unicode 文字または文字列のすべての出現箇所が別の指定された Unicode 文字または文字列に置き換えられた新しい文字列を返します。
string s = "a\0b";
string r = s.Replace('\0',' ');