問題タブ [textblob]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - 分類子textblob NaiveBayesClassifierの結果を保存するには?
NaiveBayesclassifier
選択した特定のテーマに従って、テキスト分析にTextBlob を使用しています。
データは膨大です (約 3000 エントリ)。
結果を得ることができましたが、その関数を再度呼び出して処理が完了するまで何時間も待たずに、将来の使用のために保存することはできません。
以下の方法で漬けてみました
次のようなエラーが発生しました。
sPickle も試してみましたが、次のようなエラーも発生しました。
オブジェクトを保存するために私がしなければならないことを誰か教えてもらえますか?
それとも、将来の使用のために分類器の結果を保存する方法はありますか?
python - Windows での TextBlob のインストール
Windows 7 に TextBlob をインストールするために Python 用の TextBlob をインストールする際のトラブルの指示に従いました。インストールされましたが、Python Idle に移動して入力import TextBlob
すると、
TextBlob という名前のモジュールはありません
この問題を解決するには?
または、パッケージに関連付けられているライブラリを Python Lib フォルダーに直接配置して、プログラムにインポートすることはできますか? それが望ましい場合は、それを行う手順を教えてください。それはうまくいきますか?
どんな助けでも大歓迎です。
python - Pythonでのステミング、レンマタイゼーション
他のすべてのトレイルをチェックし、いくつかのソリューションを使用しました. ポートステマーの使用に問題があります。私は接辞を取り除こうとしていますが、ポートステマーは単語をいくつかの奇妙な形式に減らします。
TextBlob を使用している単語を使用して文を検索する必要があります。以下は、使用している私のコードです。リンクからテキストを引っ張ってきました: http://www.nltk.org/book/ch03.html . そして、porterstemmer と wordnetlemmatizer を使用して言語を検索しました。Wordnetlemma は、複数形を単数形に還元するだけです。
python - Python を使用してワードフォームを作成する
Python を使用してさまざまな単語形式を取得するにはどうすればよいですか。以下のようなリストを作りたいと思っています。
私のコード:
python - Python パターン パッケージの synset による置換
私の目標は、ランダムなテキストを取得し、文を抽出し、句読点を削除し、裸の文 (そのうちの 1 つ) で、NN または VB でタグ付けされた単語をメロニム、ホロニム、またはシノニム、および WordNet synset からの同様の単語。先には多くの作業がありますが、最初に問題があります。
このために、パターンと TextBlob パッケージを使用します。これは私がこれまでに行ったことです...
これですべてが思いどおりに機能しますが、この変数から ie 下位名を抽出しようとするとdjidja
、それはオブジェクトであるため不可能であることがわかりSynset
、とにかくそれを操作することはできません。
ハイポニムリストで報告されているまさにその単語を抽出する方法はありますか(つまり、print(djidja[2])
表示されますSynset(u'bowler')
...だから'bowler'
、これからのみ抽出する方法はありますか)?
python - Pyspark-Cluster モードでのワーカー ノードへの外部ライブラリのインストール
NLP 処理などの pyspark に取り組んでいます。TextBlob Python ライブラリを使用しています。
通常、スタンドアロン モードでは、外部の Python ライブラリを簡単にインストールできます。クラスター モードでは、これらのライブラリをワーカー ノードにリモートでインストールする際に問題に直面しています。これらのライブラリを Python パスにインストールするために、各ワーカー マシンにアクセスできません。
ファイルを送信するために Sparkcontext pyfiles オプションを使用しようとしまし.zip
たが、問題はこれらの Python パッケージをワーカー マシンにインストールする必要があることです。
この lib-Textblob を Python パスで利用できるようにする別の方法はありますか?
python - 1 つではなく 2 つの機能をトレーニングする
私はこのコードを持っています。私には2つの特徴があります。2 つの機能を一緒にトレーニングするにはどうすればよいですか?
これは私が得る出力です。
word_before_you = 'do' refere : ジェネリ = 2.2 : 1.0
word_before_you = 'when' ジェネリ : refere = 1.1 : 1.0
最後の機能しか得られないようです。分類子に 1 つではなく両方の機能をトレーニングさせるにはどうすればよいですか。