問題タブ [polyglot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Polyglot Detector 関数をデータフレームに適用する方法
df.Text
テキスト (1 文以上) を含む列があり、ポリグロットDetector
を使用して言語を検出し、値を新しい列に格納したい場合、次のような他の詳細も確実にdf['Text-Lang']
取得するにはどうすればよいですか?code
confidence
戻り値
名前: 英語 コード: en 信頼度: 94.0 読み取りバイト数: 1920
しかし
で終わる
AttributeError: 'float' オブジェクトには属性 'encode' がなく、Detector は言語を確実に検出できません。
Detector 関数を間違って適用したり、出力を間違って保存したりしていますか?
python - Python ポリグロットの最大言語コード長
ポリグロットの例で提供されているほとんどの言語コードは、「en」、「es」、「zh」などの 2 文字であることがわかりました。ただし、各言語内に地域を含めることもできます。1 つの例では、ここのように「zh_hant」が含まれていました。 : http://polyglot.readthedocs.io/en/latest/Detection.html . 領域検出がオプションであるかどうか、またはデフォルトであるかどうかはわかりません。
多言語に固有のテーブルとそれらが使用する可能性のあるテーブルを見つけることができないようですが、可能な最大長を知る必要がありました. 明らかに2より大きい。
おまけ:
1. 多言語検出に領域が含まれているかどうかを指定する方法はありますか?
2. テーブルが見つからないのはなぜですか?
python-3.x - PyICU と icu4c が正しくインストールされている場合、polyglot で Import or Symbol not Found エラーが発生する
私は本当に苦労していますpolyglot
,pyicu
そしてicu4c
- そしてそれは私だけではないようです...
私はMac OS High Sierra10.13.6
とpython3をvirtualenvで実行しています
主にこの記事に基づいて、私が行った手順は次のとおりです。
- 新しい virtualenv から開始する
- homebrew で icu4c (v.62.1) を削除して再インストールする
- ICU_VERSION が「62.1」であることを確認します
- 行う
ln -s /usr/local/Cellar/icu4c/62.1/bin/icu-config /usr/local/bin/icu-config
- pyicu tar ファイル (2.1) をダウンロードします。
- リンクされた記事に示されているように、pyicu を抽出して setup.py を編集します。
- pyicu をビルドしてインストールする
そうですか:
予想通り。
- pip3 ポリグロットをインストール
スクリプトを実行すると、次のようになります。
実際には PATH に icu モジュールがないため、当然のことです。
手順 5 ~ 7 の代わりに pip3 install pyicu (icu フォルダーを作成する) を実行すると、次のようになります。
からの出力otool -L /Users/Chris/MindWeb/Server/lib/python3.6/site-packages/_icu.cpython-36m-darwin.so
は次のとおりです。
python - ライブラリ 'pycld2' を Windows 10 にインストールしようとしたときにエラーが発生しました
pycld2 をインストールしようとすると (polyglot に必要)、次のエラーが表示されます。
[WinError 2] 指定されたファイルが見つかりません
他の誰かが同じ問題に直面した場合の解決策を探しています。ありがとうございました!