問題タブ [difflib]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python difflib.Differ with Contextual difference
difflib.Differ() を使用して Line 内の文字を比較するとともに、コンテキストの違い (すべての行ではなく、違いのある行のみ) を取得するにはどうすればよいですか?
例
更新: ここで答えました: python difflib character diff with unifed contextual format
python - python difflib character diff with unifed contextual format
UNIX 統一 diff のようなスタイルで行ごとに文字の違いを表示する必要があります。difflib を使用してそれを行う方法はありますか?
それぞれ difflib.unified_diff と difflib.Differ() (ndiff) を使用して、「統合 diff」と「1 行あたりの文字数」を別々に取得できますが、それらをどのように組み合わせることができますか?
これは私が探しているものです:
python - Python の difflib SequenceMatcher の高速化
テキストファイル間の類似性を定義するために、difflib SequenceMatcher (ratio() メソッド) を使用しています。difflib は比較的高速にテキスト ファイルの小さなセットを比較できます。たとえば、平均 70 kb のファイル 10 個を相互に比較する場合 (46 回の比較)、約 80 秒かかります。
ここでの問題は、3000 個の txt ファイル (平均 75 kb) のコレクションがあることです。SequenceMatcher が比較ジョブを完了するのに必要な時間の生の見積もりは 80 日です!
「real_quick_ratio()」と「quick_ratio()」メソッドを試しましたが、ニーズに合いません。
比較プロセスを高速化する方法はありますか? そうでない場合、そのようなタスクを実行するための他のより高速な方法はありますか? Python でなくても。
python - ImportError : difflib_data という名前のモジュールがありません
Windows 7 で python 3.4 を使用しています。2 つのテキスト ファイルを比較しようとしていますが、difflib を使用してそれらの違いを報告したいと考えています。以下は、以下を使用するコード m です。
トレースバック: difflib_data インポートから * ImportError: 'difflib_data' という名前のモジュールがありません
このエラーを削除する方法....ありがとう
python - 正規表現を使用した Python difflib
A
文字列を正規表現と比較したいと思いR
ます。
このとき、 と のおかげで、構文が正しいかどうかを簡単に知ることができre.match
ますre.search
。マッチがうまくいかないときのAとBの違いを研究したいと思います。
私の最初のケースは単純です。問題が正規表現グループの一致だけにあるかどうかを知るために、正規表現([A-Za-z]+)
を置き換えます。(.+)
この場合、名前に定義されたグループを期待して文字列構文が適切であると言って、問題を簡単に提起できます。
HTML diff
ステップ1とステップ2が失敗した場合、正規表現が失敗した場所を特定するために正規表現を使用して差分を作成したいと思います。
関数を調べましたが、この関数は文字ごとにのみ機能し、部分文字列では機能しないようですdifflib
。find_longest_match
正規表現の比較に基づいて差分を特定し、類似性を測定する比率を潜在的に計算するためのアイデア/提案はありますか?
python - difflib で古いタグを回復する
古いバージョンのテキスト (text1) から一連の xml タグを復元し、それらを同じテキスト (text2) の最新バージョンに埋め込もうとしています。
例えば:
今のところ、difflib を使用して両方のバージョンをコードで別々に出力することができました。
これにより、次のことが得られます。
-
私の質問は、文字列を文字列に埋め込むにはどうすればよい+
ですか?
python - 違いを示すために 2 つのファイルを比較する Python プログラム
2 つのファイルを比較する次のコードがあります。4 または 5 MB の大きさのファイルを指定する場合は、このプログラムを実行します。これを行うと、Python コンソールのプロンプト カーソルが点滅するだけで、出力は表示されません。一度、私はそれを一晩中走らせ、翌朝まだ点滅していました. このコードで何を変更できますか?