問題タブ [fuzzywuzzy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Pythonモジュールはbashでエラーを返しますが、IDLEからは返しません
私は初めてここに投稿する初心者プログラマーです。任意の提案やアドバイスをいただければ幸いです!たとえば、test.csvとref.csv(両方とも3〜4語の文字列を含む単一の列)の内容を比較し、test.csvの各文字列に、最も類似しているものとの類似性に基づいてスコアを割り当てるプロジェクトに取り組んでいます。 ref.csvの文字列。ファジーウージー文字列照合モジュールを使用して、類似度スコアを割り当てています。
次のコードスニペットは、2つの入力ファイルを取得し、それらを配列に変換して、配列を出力します。
問題は、このスクリプトをIDLEで実行すると期待どおりに機能するが、bashから呼び出すと次のエラーが返されることです。
これが正しく機能するためにbashで構成する必要があるものはありますか?それとも、IDLEがキャッチしていない根本的な問題がありますか?簡単にするために、このスニペットではfuzzywuzzyモジュールとは呼びませんが、IDLEでは期待どおりに機能します。
最終的には、pylevenshteinを使用したいのですが、このスクリプトを使用することに価値があるかどうかを確認してから、その作業に時間をかけます。
前もって感謝します。
python - インポートエラー:「utils」という名前のモジュールがありません
すみません、私は初心者です。私はseatgeekのfuzzywuzzyモジュールを使おうとしています。Python3を使用しています
最初は、次のエラーが発生していました。
importステートメントをimportfuzzywuzzy.fuzzに変更しましたが、次のエラーが発生します。
python - FuzzyWuzzy 文字列マッチング - 大文字と小文字の区別
SeatGeek のFuzzyWuzzy String Matching モジュールを使用しています。
token_set_ratio 検索アルゴリズムを使用すると、大文字と小文字のわずかな違いで結果が大きく異なることがわかりました。
たとえば、ファイルで「I am eating」というフレーズを探している場合、100% 一致します。しかし、フレーズが「私は食べています」の場合、1 文字の変更だけで 65% の一致が得られます。
アルゴリズムの大文字と小文字を区別しないようにする方法はありますか?
python - Python 欠落モジュール v 2.7.3 および Windows 7: fuzzywuzzy をインストールし、IDLE ではなく powershell にインポートする
この問題には、私が知らない簡単な解決策があるに違いありません。グーグルとスタックオーバーフローから、パスの設定に関係があるようです。
コンピューターに anaconda をインストールしましたが、python 2.7.4 を使用しているようです。IDLEを開くときに使用されているバージョンのように見えるpython 2.7.3もインストールされています。「python setup.py install」を使用して fuzzywuzzy をインストールすると、anaconda フォルダーにインストールされ、powershell で python を使用して、コマンド「from fuzzywuzzy import fuzz」は正常に機能しますが、IDLE で同じことを行うと、モジュールが見つからないというエラーが発生します。
Python の 2 つのバージョンを調整する方法はありますか? パッケージを共有したり、すべてを台無しにすることなくバージョンの 1 つを削除したりできますか?
私はこれをやってみました:
''' PYTHONPATH / PYTHONHOME 変数の設定
スタート メニューの [コンピュータ] アイコンを右クリックし、[プロパティ] に移動します。左側のタブで、[システムの詳細設定] に移動します。表示されるウィンドウで、[詳細設定] タブに移動し、下部にある [環境変数] をクリックします。ユーザー変数のリストをクリックして Python と入力し始め、システム変数について繰り返します。これは、PYTHONPATH または PYTHONHOME の変数の設定を間違えていないことを確認するためです。次に、新しい変数を追加します (私はユーザーではなくシステムで行いましたが、ユーザーでも機能する可能性があります): PYTHONPATH を C:\Python27\Lib に設定します。PYTHONHOME、C:\Python27 に設定。'''
次に、fuzzywuzzy を再インストールし、C:Python27 フォルダーにインストールして IDLE で動作しましたが、Kivy が動作しなくなりました。
それも再インストールする必要がありますか?または、パス共有の修正はありますか?
python - パンダのあいまいマージ/一致名列、重複あり
donors
現在、 用と用の 2 つのデータフレームがありfundraisers
ます。fundraisers
寄付も行っているかどうかを確認しようとしています。もしそうなら、その情報の一部を私のfundraiser
データセットにコピーします (寄付者の名前、電子メール、最初の寄付)。私のデータの問題は次のとおりです。
- 名前と電子メールで一致させる必要がありますが、ユーザーの名前が少し異なる場合があります (例: 'Kat' と 'Kathy')。
donors
との名前が重複していますfundraisers
:- 2a) 寄付者の場合、最初の寄付日だけを気にするので、一意の名前と電子メールの組み合わせを取得できます
- 2b) 募金活動では、両方の行を保持し、日付などのデータを失わないようにする必要があります。
私が今持っているサンプルコード:
したがって、これにより、各寄付者による最初の寄付が残ります (名前と電子メールがまったく同じ人は誰でも同じ人物であると仮定します)。
fundraisers
理想的には、データセットを次のようにしたいと考えています。
私はこのスレッドに従ってみました: is it possible to do fuzzy match merge with python pandas? しかし、範囲外のエラーを取得し続けます(募金活動で名前が重複するのは気に入らないと思います):(これらのデータセットを一致/マージする方法はありますか?
forループでそれを行う(これは機能しますが、非常に遅く、より良い方法が必要だと感じています)
コード:
python - Python 2 つの文字列リストを比較して類似点を探す
私は Python の初心者ですが、すべてのダウンロードを並べ替えるプログラムを作成するのは楽しいと思いましたが、少し問題があります。目的地に単語が 1 つしかない場合は完全に機能しますが、目的地に単語が 2 つ以上ある場合は、ここで問題が発生し、プログラムがループに陥ります。リストを比較するのに私よりも優れたアイデアを持っている人はいますか
これはリスト出力の例です。
フォルダのみを含む宛先ディレクトリと、ダウンロード ディレクトリがあります。ソースファイル名を自動的に調べてから、宛先名を調べるプログラムを作成したいと思います。宛先名がソース名に含まれている場合は、ダウンロードしたファイルをコピーしてコレクションに並べ替えることができます。
今のところ、出力として「成功」だけで満足しています。近い将来、私にとってはまったく別の問題になるので、ファイルをコピーする方法を見つけます
python - リストから行を印刷するためのpython最高のあいまい率
私はいくつかの行からなるリストを持っています。最高のファジー率で「良い」という単語に一致する行を出力したいと思います。
問題:リスト内の行の代わりに唯一の印刷単語
コーディング:
期待される出力:
リストから最高の fuzzyvalue の行ではなく、1 つの単語を取得します。私のコードを修正するのを手伝ってください! 回答をお待ちしております。
python - Fuzzywuzzy インポート エラーの奇妙さ
仮想環境 [fuzzywuzzy==0.3.1] に pip install で fuzzywuzzy をインストールしました。
Pythonインタープリター(ipython経由)で、次のことを行います
これはうまく機能し、結果が得られます。
次に、以下をファイルに書き込みます (Sublime Text を使用)。
これをターミナルで実行すると、次のエラーが表示されます。
ファイル「/Users/InNov8/Projects/datamine/_MiningScripts/fuzz-test2.py」、4 行目、fuzzywuzzy インポート fuzz ImportError から: fuzzywuzzy という名前のモジュールはありません
モジュールがインタープリターに正常にインポートされるのに、スクリプトから実行するとインポートされない理由はありますか?
両方で同じバージョンの python を使用しています。つまり、virtualenv を使用しています。
アドバイスをありがとう!
python - IPython Notebook に fuzzywuzzy をインストールする際のエラー
コードでライブラリをインストールする方法が本当にわかりません。モジュール pip を使用して IPython Notebook に fuzzywuzzy をインストールしようとしましたが、エラー メッセージが表示されます。
では、コードを使用して fuzzywuzzy やその他のパッケージを正しくインストールするにはどうすればよいですか?