問題タブ [latin]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
5 に答える
66918 参照

c# - C# で ü や Ã などの特殊文字を元のラテン語の対応する文字に変換する

私はMySQLデータベースからのエクスポートを受け取りました。これは、時間の経過とともにエンコーディングが多少混乱したようで、 や などの同じ文字を表すより問題のある文字が混在してHTML char codes& uuml;ます。ファイルにある程度の一貫性を戻し、すべてを正しいラテン文字に変換するのが私の仕事です。üÃúó

私が扱っている種類の文字列の例は

Desinfektionslãsungstãƒâ¼cher fãâ¼r Flãâ¤chen

に等しくする必要があります

üC#/.Net 4.5 で、やÃtoなどを正常に再エンコードする方法はありUTF-8ますか?

それ以外の場合、どのようなアプローチが推奨されますか?

また、上記の例の文字列の段落文字は、実際の段落文字ですか、それとも他の文字の組み合わせの一部ですか?

以下の検索と置換を行う必要がある場合に備えて、ルックアップテーブルを作成しましたが、それがどの程度完全かはわかりません。

0 投票する
2 に答える
1275 参照

apache-pig - Pig ORDER コマンドが失敗する

Apache ログを分析しようとしていますが、目標は、すべてのユーザー エージェントとその使用率を調べることです。次のプログラムは、結果に各ユーザーエージェント、カウント、およびパーセンテージが含まれている場合に行に対して正常に機能します。プログラムは、最も使用されている順に並べ替えようとすると、最後の行で失敗します。誰か助けてくれませんか?

奇妙なのは、「結果のダンプ」が正常に機能することです。そのため、ORDER 行が問題を引き起こしています。

エラー:

0 投票する
3 に答える
3817 参照

hadoop - Apache Pig - 複数のバッグ間で一致する要素の数を取得するには?

私は Apache Pig の新しいユーザーで、解決すべき問題があります。

apache pig でちょっとした検索エンジンを作ろうとしています。アイデアは単純です。複数のドキュメントを連結したファイルがあります (1 行に 1 つのドキュメント)。3 つのドキュメントの例を次に示します。

次に、次のコード行を使用して、ドキュメントごとに Bag of words を作成します。

次に、バッグの重複するエントリを削除します。

このコードの結果は次のとおりです。

そのため、私が望んでいたように、ドキュメントごとに単語のバッグがあります。

ここで、ユーザー クエリをファイルとして考えてみましょう。

クエリを一連の単語に変換します。

結果は次のとおりです。

さて、ここに私の問題があります。クエリと各ドキュメントの間の一致数を取得したいと思います。この例では、次の出力が必要です。

バッグ間に JOIN を作成しようとしましたが、うまくいきませんでした。

私を手伝ってくれますか ?

ありがとうございました。

0 投票する
2 に答える
4383 参照

hadoop - Pig Latin のファイル間で一致しないレコードを抽出する

私は初心者で、豚のラテン語を学んでいます。ファイルからレコードを抽出する必要があります。T1 と T2 の 2 つのファイルを作成しました. 一部のタプルは両方のファイルに共通です. したがって、T1 にのみ存在するタプルを抽出し、T1 と T2 の間の共通のタプルを省略する必要があります. 誰か助けてくれませんか...

ありがとう

0 投票する
1 に答える
1543 参照

c# - 文字列でのキリル文字/ギリシャ語/中国語の防止 - C# 4.0

ギリシャ語、キリル文字、中国語の文字をサポートするシステム (ASP.NET C# 4.0 を使用) があります。しかし、サードパーティのシステムは正しく機能していないようです。このサードパーティ システムにデータを入力する際の問題を回避するために、テキスト フィールドを制限して、英語またはアクセント記号付きの文字のみを受け入れ、その他の文字については検証エラーを返すようにします。

どうすればこれを達成できますか? Unknown property 'Latin'\p{Latin} の行に沿って正規表現を使用できるようですが、エラーが発生するため、C# は私の経験からこれをサポートしていないようです。

0 投票する
1 に答える
1719 参照

php - キリル文字を含む文字列からすべての非ラテン文字を削除する

文字列クリーニングの正規表現に問題があります...


私が欲しい:

1) 最初の文字がキリル文字の場合 => 文字列の最初の数字またはラテン文字まですべての文字を削除する
2) 最初の文字がラテン文字の場合 => 文字列の最初のキリル文字まで文字を保存する

私がパターンで持っている部分:

しかし、2番目の部分では、ラテン文字の位置が入力文字列の中央にある場合、出力には何もありません...

正規表現を編集するのを手伝ってくれる人はいますか?

ありがとう


例 ($in[結果にある必要があります]):



0 投票する
2 に答える
3902 参照

jquery - 非ラテン文字を使用すると、一部のモバイル ブラウザでオートコンプリートが機能しない

jQuery 1.7.2 と jQuery UI オートコンプリート 1.8.22 を使用していますが、すべての PC ベースのブラウザーで正常に動作します。

Chrome 以外のモバイル ブラウザーでは、検索用語に非ラテン文字 (たとえばギリシャ語) が使用されている場合、Firefox や Safari などの他のモバイル ブラウザーは失敗します。

モバイル Firefox および Safari に影響する、知っておくべき既知の問題はありますか?