0

これまでのところ、よく知られている Java パーサーをいくつか評価してきましたが、何らかの形で実際に無料で商用利用できるものはありません。無料ですが、商用目的で利用できないトレーニング データを使用する OpenNLP と同様です。Morphadorner はありますが、2009 年に最後に更新されたようです。Stanford NLP は完全な GPL ですが、LingPipe は有料ライセンスを提供します。

現時点では資金提供を受けていないスタートアップであるため、高額のライセンス料を支払うことは実際には不可能です。業界標準のソリューションとは比較にならない要件に合わせてルールベースのパーサーを実装する必要がありました。

とはいえ、私はフリークではありませんし、世界で数人しか使っていないものを必要としているわけでもありません。私は、NLP のようなものが人気を得ていると固く信じており、POS タガーを再び実装することは、車輪を再発明するようなものです。これに対する業界標準のソリューションは本当にないのでしょうか?

更新:業界標準の考え方は、有料のものを意味するようです。では、HTML パーサーのいくつかのライブラリ (とりわけ) が無料になったのはなぜですか。Html パーサーは NLP よりもはるかに使用されていますが、それでも NLP タスクにはかなり大きな要件があります。

更新: 質問は終了しました。Wordnet とさまざまなプリティ ルールを使用するキーワード抽出用の小さな小さなライブラリをすぐにリリースできることを嬉しく思います。ありがとうAB

4

1 に答える 1

4

あなたはすでに解決策を特定しています:

スタンフォード NLP は完全な GPL です...

商用プロジェクトで GPL を使用することを禁止するものはありません。

問題は、コードをバイナリ形式で配布する場合、ソース コードも提供する必要があることです。つまり、ビジネス モデルは (ソフトウェア ライセンスを販売するのではなく) 顧客に有料のサポートやサービスを提供することに基づく必要があります。


このトピックに関する別の Q & A と、他の潜在的なリードを次に示します。


業界標準の考え方は、有料のものを意味するようです。では、HTML パーサーのいくつかのライブラリ (とりわけ) が無料になったのはなぜですか。Html パーサーは NLP よりもはるかに使用されていますが、それでも NLP タスクにはかなり大きな要件があります。

このようなものを開発するチーム (または組織や会社) は、ライセンスをどのように付与するかを決定します。既存の NLP サービスはどれも「ビールのように無料」ではないようです。それが彼らの選択です。それに、文句を言う権利はありません...アプリケーションを「ビールのように無料」で利用可能にしないことも選択していることを考えると。

そして、私が指摘したように、スタンフォード NLP は「Libre のように無料」です。GPL の義務を受け入れる準備ができていないだけです。

誰もあなたに無料で何かをする義務はありません。起業家志望者として、あなたはそれを期待すべきではありません。

(FWIW、ビールのように無料の HTML パーサーが存在する理由、および他の多くの理由は、通常、問題が NLP よりも桁違いに簡単であるか、または多くの寄付をした企業/組織がそこにあるためです。コードを開発するためのリソースの。)

于 2013-05-27T03:24:19.400 に答える