問題タブ [text-manipulation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
regex - diff 出力から不要なコンテキスト行を削除します (sed を使用)
diff
いくつかのファイルから入力を得ました。これらのファイルには、空の行で区切られた 4 行の情報ブロックが含まれており、1 ~ 3 行が異なる場合があります。
行自体には価値がないため、完全な情報ブロックを取得するには、異なる行の周りのコンテキストが必要なのでdiff
、パラメーターを使用して呼び出します。-c3
このため、私の出力は非常に雑然として読みにくくなります。したがって、異なるブロックに属さないコンテキスト行を切り取る方法を探しています。
入力ファイルのサンプル:
私のシナリオを再現するには、これを使用して、いくつかのランダムな行を変更してください。
2 つの異なるファイルで実行するdiff -c3
と、次のような結果が得られます。
私は最善の sed トリックを試しましたが、必要な情報をコンテキストの乱雑さから分離できませんでした。目的の出力は次のようになります。
-> 行番号を含む行さえ必要ありませんが。シンプルなセパレーターで十分です。
私はこれを試しました:
この:
*
また、との-
文字をマスクしたり、 の 1 つだけを使用したりして実験しまし\*
た。囲み括弧の有無にかかわらず、それらをマスクおよびマスク解除して使用しても、何も機能しませんでした。
ヘルプ?お願いします?
おまけの質問: diff の代わりに colordiff を使用してこれを行いたいと思います。それは難しさを増すでしょうか(カラーコードが埋め込まれているなどの理由で)?
php - UTF8 テキストに str_word_count を使用する
私はこのテキストを持っています:
最近はこれを使っていました。
このフィドルで確認できます:
http://ideone.com/oVUGYa
ただし、この解決策ですべての UTF8 の問題が解決されるわけではありません。パラメータとして str_word_count にUTF8 セット全体を書き込むことができません。
だから私はこれを作成しました:
出力は次のようになります。
これはうまく機能しますが、すべての文語問題をカバーしているわけではありません。たとえば、str_replace でコンマとドットを削除しました。
たとえば、このソリューションでは次のような単語はカバーHello Mike,how are you ?
されません。Mike と how は別の単語として扱われません。
これは str_word_count solution: ではカバーされていませんKISMEN @here #there
。アットマークとダッシュ記号は考慮されません。
これはカバーされませんJ.J.Johanson
。言葉ではありますが、JJJohanson
質問、感嘆符は単語から削除する必要があります。
サポートstr_word_count
で動作を取得するより良い方法はありますか? UTF8
この$text
質問の上部にある は、私にとって参考になります。
(答えにフィドルを提供できるとよいでしょう)
excel - テキスト操作 Excel - 文字列内の 2 つの文字を交換する方法は?
ユーザーが指定したスワップする文字列と位置を使用して、Excel の文字列内の 2 つの文字をどのように交換しますか?
例えば:
ユーザーは「こんにちは!」という文を入力します。
ユーザーは、1 から LEN (センテンス) の半分までの整数を入力します: 2
出力: 「He theri!」
最初のインスタンスを置き換えることはできますが、2 番目のインスタンスを置き換える方法がわかりません。
これまでのところ、私が持っているものを達成するために REPLACE と MID 関数を使用してきました。
ありがとう!
ruby - Ruby: .txt ファイルをテンプレートとして扱うにはどのような方法がありますか?
次のテンプレートを取得しました。
そして、各情報を実際のデータに置き換えて .txt ファイルに入れる必要があります。Ruby でこれを処理するにはどうすればよいでしょうか?
どうも
c# - 文字列から Markdown タグを削除する
内部に Markdown タグが埋め込まれた文字列があります。Markdown を他のものとしてエンコードしたくはありません。すべてのタグを取り除きたいだけです。
どうすればこれをすばやく行うことができますか? これは、約 500 万個のテキストを処理するバッチ処理ジョブの一部として行う必要があるため、速度が非常に重要です。
MarkdownSharp と using を調べましたTransform
が、これが最善の方法かどうかはわかりません。内部にタグを含まないプレーンテキスト出力が必要です。正規表現の削除も検討していますが、最もパフォーマンスの高いオプションが何であるかはわかりません。
sas - SAS の文字列内のテキストの順序を並べ替えますか?
「name」という文字変数を持つデータセットがあります。「ファーストネーム ミドルネーム ラストネーム」のような人物のフルネームが含まれています。
「姓、名、ミドルネーム」になるようにデータを再配置したいと思います。
私は SAS 関数にそれほど熱心ではありませんが、私が知っている数少ない関数のいくつかを使用しました。
(私のコードは以下に見ることができます)。
最初の試行 (test2) では、必要な結果が得られません。「lastName、firstName middleName」ではなく、「lastName、firstName middleName」が表示されます。問題はコンマです。
そこで、最後にコンマを含む af new last name 変数を作成することで問題を解決できると考えました (test2_new 内)。しかし、私は欲しいものを手に入れませんか?SAS は末尾に 3 つのドットを付けましたが、コンマではありませんか?
私よりも SAS のスキルが高い人が私の質問に答えてくれるといいのですが??
敬具マリア
powershell - Powershell は、リスト形式のレコードをテーブル形式に変換します
リストされたプロパティを CSV またはテーブルに変換するためのパワーシェルを探しています。リスト内のすべてのレコードが同じプロパティを持つわけではありませんが、「インデックス」プロパティは新しいレコードを示します。
入力
出力
どんな助けでも大歓迎です。ありがとう
linux - AWK を使用して選択した変数を操作する
AWK を使用して操作しようとしている SQL ファイルがあります。VALUES
このフィールドの前後のテキストを別々に処理したいので、SQL ファイルを分割する次の行があります。
元のファイルは次のようになります。
私のAWKコード:
これが生成されます:
あとは、drt_mig_user を削除し、最初の変数全体からバッククォートを削除して、次の$1
ようにするだけです。
このように変数を別々の方法で操作する方法はありますか?
python - Flask Web サイトのループを介して HTML オートコンプリート リストにリストを挿入する
Python および Jinja2 (Flask 経由) を介して Web ページに配置するオートコンプリート関数リストを作成しようとしています。
データ:
これは、私のテンプレートに付属しているデフォルトの外観です。
私は試した:
そして何も起こりません.HTMLをロードすると、「data-autocomplete=
」は何もありません..
これの論理は間違いなく間違っていることがわかります。
Jinja を使用して for ループを構造のようなリストに入れる方法に関するドキュメントはあまり見つかりませんでした。
これは完全に間違った方法だと思います。ヘルプ?
望ましい出力:
java - スレッドを使用して大文字/小文字を出力し、入力から出力に反転します
input.txt
入力行の各文字が小文字の場合は大文字に、大文字の場合は小文字に変わるように、各行を読み取って各行を印刷しようとしています。さらに、Thread
各行の反転も印刷したいので、これを行うために a を使用したいと思います。
とのエラーが発生しprintUppLow uppLow = new printUppLow();
ますprintRev rev = new printRev();
コード