問題タブ [textblob]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - textblob ngram で短縮形を維持する
ngram を作成するときに #textblobに&のような短縮形を分割しないように指示する方法はありますか? 技術的には 2 つの別個の単語であることはわかっていますが、1 つの単語として維持したいと考えています。let's
let
's
python - これは Python の TextBlob ライブラリで、'gonna' のような短縮形を解析するときのバグですか?
テキストからの情報抽出に TextBlob ライブラリを使用しようとしています。このエラーに出くわしたため、多くの問題が発生しました。なぜこれが起こっているのか教えてください.それを避ける方法はありますか.
「したい」、「しよう」などの単語でも同じ問題が発生します。
python - python.cannot import name 'TextBlob'
TextBlob を Python にインポートしようとしていました。
コマンドをシェル内で直接実行すると、かなりうまく機能します。 from textblob import TextBlob
ただし、それをpyファイルに入れて実行すると、もう機能しません。
私を助けてください、今とても必死です...どうもありがとう
python-2.7 - 分析のためにストリームからASCIIをデコードする方法
textblob ライブラリから感情分析を介して Twitter API からテキストを実行しようとしています。コードを実行すると、コードは 1 つまたは 2 つの感情値を出力し、次のエラーにエラーを出力します。
テキストのみを分析している場合、これがコードで処理する問題である理由がわかりません。スクリプトを UTF-8 にコーディングしようとしました。コードは次のとおりです。
誰かがこの状況で私を助けてくれませんか?
前もって感謝します。
python - 'u' は TextBlob 内のすべてのテキストの先頭に追加されます
テキストデータの処理に Textblob を使用しています。
私のコードは次のとおりです。
次のような出力が得られます。
それ以外の:
各単語の前に文字「u」が追加される理由は何ですか?
私はPython 2.7.6バージョンでUbuntu 14.04.2に取り組んでいます。
arrays - 配列への Textblob 単語のトークン化
印刷された結果は次のようになります。
[WordList(['i', 'have', 'a', 'bunch', 'of', 'grapes']), WordList(['i', 'like', 'to', 'eat', ' apple']), WordList(['これ', 'は', 'a', 'ラップトップ'])]
私のarray2が次のように印刷されるように、WordListから抽出するにはどうすればよいですか。
[['i', 'have', 'a', 'bunch', 'of', 'ブドウ'],['i', 'like', 'to', 'eat', 'apple'],[ 「これはラップトップです」]]
python - NLTK を使用してテキスト内の理由を見つける
仕事中の私のプロジェクトでは、ユーザーが作成した一連のテキストを処理することを任されており、そのテキストの一部には、インターネット サービスをキャンセルする理由と、その理由が発生する頻度が含まれています。彼らが引っ越している、単に気に入らない、サービスが悪いなどの可能性があります。
これは必ずしも Python の質問ではないかもしれませんが、NLTK または Textblob を何らかの方法で使用してキャンセルの理由を判断できる方法があるかどうか疑問に思っています。このような特殊なタスクのために自動化されたものがあることは非常に疑わしく、ニューラル ネットワークを構築する必要があるかもしれないことは理解していますが、この問題に取り組む方法についての提案をいただければ幸いです。
1) ステミングとトークン化を使用し、最も頻繁に使用される単語を集計します。簡単な方法ですが、それほど正確ではありません。2) n グラム。計算集約的ですが、ある程度の見込みがあるかもしれません。3) POS のタグ付けとチャンキング。「because」などの接続詞に続く単語を見つけることができます。4) すべてのテキスト フィールドを手動で確認し、キャンセルの理由をメモします。効率的ではなく、何らかのアルゴリズムを見つけるという目的全体を無効にします。5) NN さん、まったくわかりませんし、実現可能かどうかもわかりません。
これに関するアドバイスをいただければ幸いです。
python-3.x - Windows で Conda を使用して TextBlob をインストールする
textblob に関する既存の質問では、conda について説明していないため、新しい質問を試してください。
私はdoanloading / TextBlobをインストールしようとしました https://textblob.readthedocs.org/en/dev/install.html#with-conda
しかし、https://conda.binstar.org/sloriaはOSX専用です
代わりにhttps://binstar.org/sursma/textblobを試してみましたが、まだあまり運がありません
C:\Users\kumar\AppData\Local\Continuum\Anaconda3>conda install -c https://conda.binsta.org/sursma textblob パッケージ メタデータを取得しています: ... https://conda.binsta に接続できませんでした。 org/sursma/noarch/ https://conda.binsta.org/sursma/win-64/ に接続でき ませんでした エラー: URL が見つかりませんでした: https://conda.binstar.org/sursma /win-64/
ありがとう !