問題タブ [text]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c# - テキストファイルのエンコーディング/コードページを検出するにはどうすればよいですか?
このアプリケーションでは、さまざまなソースからテキストファイル(、など)を受け取り.txt
ます.csv
。読み取るときに、これらのファイルにはガベージが含まれることがあります。これは、ファイルが別の/不明なコードページで作成されたためです。
テキストファイルのコードページを(自動的に)検出する方法はありますか?
コンストラクターdetectEncodingFromByteOrderMarks
上の、は、およびその他のUnicodeでマークされたファイルに対して機能しますが、、などの コードページを検出する方法を探しています。StreamReader
UTF8
ibm850
windows1252
あなたの答えをありがとう、これは私がしたことです。
私たちが受け取るファイルはエンドユーザーからのものであり、コードページについての手がかりはありません。受信者はエンドユーザーでもあります。これは、コードページについて知っていることです。コードページは存在し、煩わしいものです。
解決:
- 受信したファイルをメモ帳で開き、文字化けしたテキストを確認します。誰かがフランソワか何かと呼ばれているなら、あなたの人間の知性であなたはこれを推測することができます。
- ユーザーがファイルを開くために使用できる小さなアプリを作成し、正しいコードページが使用されたときにファイルに表示されることをユーザーが知っているテキストを入力します。
- すべてのコードページをループし、ユーザーが提供したテキストで解決策を提供するコードページを表示します。
- 複数のコードページが表示される場合は、ユーザーにさらにテキストを指定するように依頼してください。
sql - 任意の(おそらくマークアップされた)テキストをSQLに保存する標準的な方法は何ですか?
wikis/stackoverflow/etc は何をしますか。テキストの保存に関してはどうしますか?テキストは改行で壊れていますか? 固定長のチャンクに分割されていますか? 任意に長いテキストのチャンクを保存するにはどうすればよいでしょうか?
sql - SQL はテキストを取り除き、整数に変換します
私のデータベース(SQL 2005)にはコメントを保持するフィールドがありますが、コメントにはIDがあり、IDだけを取り除き、可能な場合はそれをintに変換したいと思います:
activation successful of id 1010101
上記の行は、db フィールドのデータの正確な構造です。
いいえ、アプリケーションのコードでこれを実行したくありません。念のため、実際には触れたくありません ;-)
wpf - WPF でのカスタム テキスト ラッピング
WPFで長方形以外のコンテナにテキストをラップする方法はありますか?
python - 段落を分割するPython正規表現
Python で段落を分割するために使用する正規表現をどのように記述しますか?
段落は 2 つの改行 (\n) で定義されます。ただし、改行と一緒に任意の量のスペース/タブを含めることができ、それでも段落と見なす必要があります。
私はpythonを使用しているので、ソリューションは拡張されたpythonの正規表現構文を使用できます。((?P...)
ものを利用することができます)
例:
私ができる最高のものは: r'[ \t\r\f\v]*\n[ \t\r\f\v]*\n[ \t\r\f\v]*'
、すなわち
しかし、それは醜いです。もっと良いものはありますか?
編集:
拒否された提案:
r'\s*?\n\s*?\n\s*?'
\s
-> includesであるため、例 2 と 3 は失敗する\n
ため、2 を超える段落区切りが許可され\n
ます。
python - テキストファイルを変更するには?
私は Python を使用しており、ファイルを削除またはコピーせずに文字列をテキスト ファイルに挿入したいと考えています。どうやってやるの?
xml - 非Web開発アプリケーションのXMLとテキスト
私は、自分のアプリがWebを介した通信に使用されたり、ブラウザーを介して表示されたりする可能性がないシステムプログラミングを数多く行っています。しかし、XMLを使用するように経営陣からのプッシュがありました。たとえば、タイムログを保持したい場合は、次のようなテキストファイルを使用できます。
コマンド日時プロジェクト
2008/09/2308:00:00PROJ1
変更2008/09/2309:00:00PROJ2
アウト2008/09/2312:00:00PROJ2
2008/09/23 01:00: 00PROJ3
アウト2008/09/2305:00:00PROJ3
XMLは次のようになります。
<timelog>
<timecommand cmd=in date=2008/09/23 time=8:00:00 proj=PROJ1/>
..。
<timecommand cmd=out date=2008/09/23 time=5:00:00 proj=PROJ3/>
</timelog>
私が見るテキストバージョンの最初の利点のいくつかは、それが簡単に読みやすく、正規表現で解析できることです。この場合、XMLを使用する利点は何ですか?
text - 改行文字
あなたのソフトウェアは、他のシステムからの改行文字を処理しますか?
念のため、テキスト ファイルでは Linux バージョンの改行文字を使用します。しかし、テキスト ファイルを Windows に持ち込むと、一部のプログラムは、テキスト内の改行文字をうまく処理できません。これにどのように対処しますか?
c++ - C ++ std::stringでアクセントとチルダを削除する方法
スペイン語の単語がいくつかあるC++の文字列に問題があります。これは、アクセントやチルダのある単語がたくさんあることを意味します。アクセントのないものと交換したいと思います。例:この単語を置き換えたい:habiaの「había」。直接置き換えてみましたが、文字列クラスのreplaceメソッドを使って置き換えましたが、うまくいきませんでした。
私はこのコードを使用しています:
このようなマップはどこdictionary
にありますか(より多くのエントリがあります):
toReplace
文字列は次のとおりです。
私は明らかに何かが欠けているに違いありません。私はそれを理解することはできません。使用できるライブラリはありますか?
ありがとう、
c# - 解析パフォーマンス (If、TryParse、Try-Catch)
テキストを解析して情報を得るさまざまな方法について、私はよく知っています。たとえば、整数を解析する場合、どのようなパフォーマンスが期待できますか。誰かがこれに関する良い統計を知っているかどうか疑問に思っています. これをテストした人からの実数を探しています。
これらのうち、どの状況で最高のパフォーマンスを提供するのはどれですか?