問題タブ [polyglot]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python Polyglot の UTF-16 コード単位
Python 文字列から場所名が始まる文字列の先頭から、UTF-16 コード単位の数を抽出する必要があります。Polyglot NER を使用して、Python 文字列の場所にタグを付けています。たとえば、「オバマは米国で生まれました。しかし、私はアラバマで生まれました」の場合、「米国」と「アラバマ」をマークします。Python Polyglot エクストラクタは、タグ付けされた場所と、それらが開始する先頭からの単語数を返すだけです。単語が出現する文字列の先頭からの UTF-16 コード単位の数を把握するにはどうすればよいですか?
情報を必要とする Java インターフェースhttps://github.com/Berico-Technologies/CLAVIN/blob/master/src/main/java/com/bericotech/clavin/extractor/LocationOccurrence.java
pypi - Python Packaging Fix: Wheel と Egg の違いを理解する。より多くの視聴者にローカル フィックスを提供する方法は?
easy_install がpyicu
機能する理由とpip install
機能しない理由を理解しようとしています (以下を参照)。また、「ユニバーサル ホイールを使用する PyPi プロジェクトと使用しない PyPi プロジェクトの違いは何ですか?」を理解しようとしています。インストールは「簡単ですか?」もしそうなら、このマージ リクエストは、多言語が Anaconda マシンにインストールされないという問題を解決しますか?
基礎となる依存関係に関連する python プロジェクトのインストールの問題を最適に解決する方法について、ヘルプ/アドバイス/解決策が必要です。GitHub Gists に 2 つのローカル修正がありますが、私のような人が見つけられるように、この修正を「公開」する最善の方法を知りたいです。通常の Python コミュニティのアプローチとは何ですか? 問題は、次の 3 つのプロジェクトに集中しています。
- polyglot - Python 多言語 NLP ツールキット
- pyicu - IBM の International Components for Unicode C++ ライブラリ (ICU) をラップする Python 拡張機能.
- pycld2 - Dick Sites が管理する CLD (コンパクト言語検出) ライブラリ
目標:
- Python Anaconda Distribution を実行している MacOSX コンピューターにpolyglotをインストールする
- 私が見つけた修正をすべての人が利用できるようにします。問題について公開された多くの問題。
問題(たくさんあります):
- コア ポリグロット依存関係であるpyicuは、 を使用すると正しくインストールされません
pip install
。easy_install
適切にビルドして MacOSX で動作させるために使用する必要があることがわかりました。を使用しない場合はeasy_install
、次のようになります。 - polyglotを Anaconda で実行するには icu 54.1.1 が必要ですが...
- インストールする MacOSX ツールである Homebrew は、バージョン 58.1
icu
のみをインストールします。そのバージョンは新しすぎます。古いスタックオーバーフローは問題を修正するようにアドバイスしていますが、Homebrew の進化により、そのアドバイスは現在では時代遅れになっています。brew install icu4c
- pyicuにはユニバーサル ホイールがありません。に追加するマージ リクエストを作成しました
pyicu
。これを修正する唯一の方法は、このチャネルのicu
https://anaconda.org/ccordoba12/icuを使用することです。conda install icu
うまくいきませんが、それが通常のconda
やり方です。
* pycld2 - ホイール ファイルをローカルでビルドした後、プロジェクトをダウンロードして setup.py install をローカルで実行する必要があるため、CLD (コンパクト言語検出) が問題になります。これを正しく行うためのより良い方法が必要ですか?
問題を解決するために何をしたか (もっとやるべきか、次に何をすべきか)
- Python 2.7 または Python 3.5 用の Anaconda を実行している Mac に polyglot を正常にインストールできる 2 つの Gist を作成しました。
- Python 2.7 の修正
- Python 3.5 の修正
- のマージリクエストを作成しました
pyicu
どちらの Gist 修正も機能します。しかし、インストール時のこのエラーはホイールに関係しているのでしょうか? でインストールpyicu
した場合easy_install
、インストールは機能します。しかし、pip
そうではありませんか?
人々が解決策を見つけられるように、または問題なく解決できるように、Python コミュニティで修正する手順は何pip install
ですか?
テストを行ったところ、wheel
ファイルがビルドされていれば、pip は問題なく動作します。
python - 仮想環境に python Polyglot パッケージをインストールする際の問題
Mac (OS X El Capitan 10.11.6) の仮想環境に複数のパッケージをインストールしようとしています。polyglot (バージョン 16.7.4) のインストールに成功しました。Python (バージョン 3.6) を起動するまで、すべて正常に動作します。
これは、多言語からテキストをインポートしようとした結果として得られるものです。
仮想環境を作成するために、ディレクトリ パスを指定して venv モジュールをスクリプトとして実行しました。
何をすべきかについて何か考えはありますか?
python - ImportError の解決方法: 名前 'ProcessPoolExecutor' をインポートできません
polyglot ライブラリを初めて使用しようとすると、このエラーが発生します。
ここに完全なエラーメッセージがあります。
Python 3.5.2 のバージョン
どうすればこの問題を解決できますか?