問題タブ [extended-ascii]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - トークンによる文字列の一致-コンセプトチェック
この質問はコンセプトチェックのためのものです。リスト{000.00-012.0.0.0および000.00-008.0.0.0}から最も近い一致を見つけたい文字列000.00-010.0.0.0があります(編集メジャーに数値距離メジャーを含めます) 「012」、「010」、「008」をトークンとして取り、これらの間の距離を測定するのが好きです。
文字列一致への標準的なアプローチでは、各文字位置の変化を探し、変化を合計して距離を返します。変更された距離は、CHARS間のASCII距離も測定します-GはDよりもEから遠いです。
'012'が'010'に対して'008'であることを測定するには、3つの文字をトークンにバンドルする必要があります。このトークンは、編集距離と距離を簡単に測定できますか?ツリーデータベースの区切り文字を削除すると、問題はより複雑になります。
現実をチェックしたい私の提案した解決策は、「012」、「010」、および「008」を単一のCHAR ASCII記号、たとえば)、*、および+に変換し、文字距離と文字列編集距離を測定してから、印刷することです。 '012'、 '010'、および'008'に変換し直します。
サンプル文字列:MER99.C0.00M.14.006.00.060.350
そして、ワイルドカードがあります:
MER99.*.006.00.060.350
MER99.C0.00M.??.006.00.060.350
文字列は同じ長さであるため(長さにはダミー文字が必要な場合もあり、「00M」は実際には「M」です)、ハミング距離と一致します。
一致アルゴリズム、ハミング距離アプローチ、ワイルドカード、またはダミー文字についてのヘルプは必要ありません。これをコンテキストとして質問に追加しました。現在、トークンを個別の文字として扱い、良好な結果が得られますが、トークンとして処理した場合ほど正確ではないことを知っています。制限要因は、おそらくコーディングスキーマ内の不整合です。ただし、アルゴリズムではなく、それを制限として使用したいと思います。
c# - 128-130 の範囲の ASCII 値を持つ char を読み取り、それを int 値に変換する方法
私は文字の配列を持っています。それらのいくつかは ASCII 128 と 130 の 10 進数です。それらを通常の文字として読み取ろうとしていますが、128 の代わりに 8218 を int として取得します (バイトにキャストして 26 を取得)。128 から 130 の間の数値を取得する必要があります。エンコーディングに関する記事をいくつか見つけました。エンコーディング 439 を使用する必要があると言う人もいます。
何か案は?
javascript - javascript文字列の拡張ASCIIの有効な文字サブセット
私はデータエンコーディングでいくつかの実験をしています。すでにbase64形式があることは知っていますが、スペースを取らないものが欲しいです。注意してください、私は彼らの数だけでなく、特定のキャラクターを求めています。
1.拡張ASCIIのどの文字サブセットをJavascript文字列で表すことができますか?
2.拡張ASCIIのどの文字サブセットをJavascript文字列で表すことができますか?文字列データの周囲に「文字が使用されている」と仮定して、エスケープする必要はありませんか?
c# - WindowsフォームC#で拡張ASCIIを10進数に変換するにはどうすればよいですか?
私はWindowsアプリケーションを書いています。拡張ASCII[128-256]を同等の10進数に変換する際に問題が発生しています。
jarファイルから「Œ」などの拡張ASCIIを受信すると、次のようにC#アプリケーションに入ります。
これを10進数に相当する[ie]140に変換する方法を教えてください。
私を助けてください。どうすればいいですか?
c# - Java から C# - jar サーバーから C# クライアントへのバイトの送信/読み取り
私はWindowsアプリケーションを書いています。jar ファイルからのバイトの送受信に問題があります。
jar ファイルから 2 バイトが送信されます [ie. !©]
1バイト目は文字コード0~127までなので正しく読めます。しかし、2 バイト目: 拡張 ASCII は、jar ファイルから "©" と言うと、C# アプリケーションでは �</p>
同様に、「©」をjarファイルに送信すると、jarはそれを�として読み取ります
この問題を解決する方法を教えてください。
jarからバイトを読み取るためにこのコードを使用しています:
バイトをjarに送信するためにこのコードを使用しています:
親切に私を助けてください? C# と Java の両方で同じ文字コードを取得するにはどうすればよいですか??
linq-to-sql - LinqToSQL によって等しいと見なされる異なる ASCII 記号/文字
LinqPad でクエリを実行すると、奇妙な動作が発生することがわかりました。一部の ASCII 記号/文字は、実際には等しくない場合でも、LinqToSQL によって等しいと見なされるようです。
次のクラスを考えてみましょう (対応するテーブルを使用)。
テーブルに「⇒」(右矢印) と「⇐」(左矢印) の行を追加すると、次のクエリはそれらが等しいことを示します (結果には 2 つの項目が含まれます)。
.ToList() への呼び出しを追加してクエリを変更すると、期待どおりの動作になります (結果は空です)。
これがどのように起こるかについてのアイデアはありますか?
utf-8 - 拡張 ASCII から UTF8 にエンコードする際の一貫性の確保
これは問題ではないかもしれませんが、私は SO の収集された知恵を参考にして見つけてください。
エンコーディングがプラットフォーム間で一貫していることを確認しようとしています。行くべき道は明らかにUTF8です。ただし、一部のプラットフォームでは、残念ながら拡張 ASCII (通常は Windows コードページの何らかの形式) が使用されます。Windows コードページから UTF8 にウムラウトなどで何かをエンコードする場合、文字の UTF8 内で複数の可能な選択肢があることが懸念されます。
別のプラットフォーム (Linux、Mac OS) で、そこで選択された UTF8 文字が一貫していることをどのように確認しますか?
私が言ったように、多分これは問題ではありません。私が知らない標準的なマッピングがあるかもしれません。問題は見られませんでしたが、同僚が懸念を表明したので、情報を探しています.
よろしくお願いします。
sql-server - SQL Server での拡張 ASCII 文字検索
♥,♦,♣....
1 つの列に拡張 ASCII 文字 ( など)を含むデータが含まれる可能性があるテーブルがあります。
クエリを使用して同じものを検索するとselect
、結果セットは次のように正確にフェッチされません:
次のような拡張ASCII文字を含む名前を検索すると
結果セットは id2、id3 を表示します。
それも、元の文字の代わりに疑問符 ( ?
) 記号を使用します。
何か助けはありますか?結果セットはid2
上記の検索クエリに対してのみ表示されるはずです
php - str_replace がこれらの拡張 ASCII 文字を正しく置換しないのはなぜですか?
これは UTF-8 でエンコードされたソース ファイルです。明らかな何かが欠けているに違いありませんが、考えられるすべての順列を試しました。
そして、ブラウザで開いてソースを表示すると...
mysql - 拡張ASCII文字は、MySQLデータベースにジャンクとして表示されます。perlを介して挿入されます
MySQLの「articles」テーブルがあり、SQLyogを使用して次の挿入を作成しようとしています。
これは正常に機能し、選択クエリを実行するとデータが正常に表示されます。
問題は、perlスクリプトを使用して同じ挿入クエリを実行すると、データベースのéとôの代わりに名前がジャンク文字で表示されることです。スクリプトを使用して名前を適切に保存する方法を知る必要があります。挿入を行うコードの部分は次のようになります。
$idと$titleには、挿入する前に印刷で確認した正しい必要なデータがあります。手伝ってください。