問題タブ [wordbreaker]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
956 参照

sql-server - フルテキスト ワード ブレーカーで使用されているドイツ語の単語のリストがあるかどうか知っている人はいますか?

SQL Server フル テキスト検索では、言語固有のワード ブレーカーが使用されます。

ドイツ語では、複合語を含む単語を分割/分割するために使用されます。ただし、すべての既知の複合語がワード ブレーカーに含まれているわけではないようです。Word Breaker が認識している単語のリストが利用可能かどうかを知りたいです。

0 投票する
2 に答える
122 参照

javascript - 単語を「分割」できる文字を定義できますか?

Safari 拡張機能に非常に長い URL が表示されます。明らかに、それらは単一の行に収まりません。現在、単語分割ルールにより、ほとんどの URL は 2 行で構成されています。最初の行はかなり短く、?記号で終わり、もう 1 行は途方もなく長く、残りのすべてのGETパラメーターが含まれています。

&可能であれば、コピーと貼り付けを台無しにすることなく、単語も記号で区切られるようにしたいと思います。&everyを&\u00ad( + ソフト ハイフン文字)に置き換えようとしましたが、実際には URL にハイフンがないのに、の&後にハイフンが表示されるのはちょっと奇妙です。&

そういう問題はCSS3で何とかしようかなと思ったのですが、見当たりません。

Safari で動作する限り、どんな提案も歓迎します。

0 投票する
1 に答える
118 参照

java - この Java アプリケーションの実行のヘルプ

このソース コードを受け取りました: http://www.sbbic.org/split.zip Apache 2.0 ライセンスの下: http://www.apache.org/licenses/LICENSE-2.0

ドキュメントやサポートなしで著者から私に届きました(著者には今時間がなく、本を書いています)。Java に関する私の知識は非常に限られています。

ソースに含まれているcolumns.txtファイルの単語を分割するためにアプリケーションを実行する方法を教えてもらえますか?

コマンドラインで呼び出す方法を見つけようとして TextSegmenter.java を調べましたが、うまくいきませんでした。

java com\whitemagicsoftware\dictionary\TextSegmenter lexicon.csv columns.txt を呼び出すと、次のエラーが発生します。

スレッド「メイン」での例外 java.lang.NoClassDefFoundError: com\whitemagicsoftware\dictionary\TextSegmenter (間違った名前: com/whitemagicsoftware/dictionary/TextSegmenter) java.lang.ClassLoader.defineClass1(Native Method) at java.lang. ClassLoader.defineClass(ClassLoader.java:620) で java.security.SecureClassLoader.defineClass(SecureClassLoader.java:12 4) で java.net.URLClassLoader.defineClass(URLClassLoader.java:260) で java.net.URLClassLoader.access$000 (URLClassLoader.java:56) で java.net.URLClassLoader$1.run(URLClassLoader.java:195) で java.security.AccessController.doPrivileged(ネイティブ メソッド) で java.net.URLClassLoader.findClass(URLClassLoader.java:188) でSun の java.lang.ClassLoader.loadClass(ClassLoader.java:306) で。misc.Launcher$AppClassLoader.loadClass(Launcher.java:276) で java.lang.ClassLoader.loadClass(ClassLoader.java:251) で java.lang.ClassLoader.loadClassInternal(ClassLoader.java:319) で

私はそれを.jarに入れようとしました(これも限​​られた経験で、手動で作成されたマニフェストファイルが含まれているファイルのみを圧縮しました)が、ロードできません。

私は初心者です - これがばかげた質問であれば申し訳ありませんが、助けていただければ幸いです!

スクリプトの目的は、結合された単語 (例: "addresstype") を別の単語 (例: "address" と "type") に分割することです。単語間にスペースを使用しないクメール語の単語を分割する際に、このスクリプトを使用することが期待されています。

ありがとうございました!

0 投票する
1 に答える
734 参照

sql-server - ハンガリー語用のサードパーティのSQLServerワードブレーカーのようなものはありますか?

CONTAINS全文索引で使用FORMSOF(...)し、ハンガリーのデータで使用したいと思います。出来ますか?SQLServerではデフォルトでサポートされていないことを知っています。

0 投票する
5 に答える
1150 参照

java - Java トークナイザーまたはワード ブレーカー、およびさまざまな言語用

次の文字列のトークン化または単語の分割とノイズの除去を行うのに役立つJavaベースの言語ユーティリティがいくつかあるのではないかと思います

文字列の場合

期待される結果は一連の単語になります

と が削除された場所

そして文字列の場合

期待される結果は言葉になる

I、to、the、および が削除された場所

0 投票する
1 に答える
501 参照

c# - スタンドアロン C# プログラムで Microsoft SQL Server 2005 のワード ブレーカーを使用する方法

Microsoft SQL Server 2005 で全文検索インデックスを照会するプログラムを作成しています。インデックスが作成されるデータは、テキストの大きな塊 (複数行) です。

結果とともに表示する検索語を含むテキスト行のみを抽出する必要があります。

したがって、Sql Server のワード ブレーカーとステマーを使用して、BLOB のテキストの各行が検索文字列と一致するかどうかを判断する必要があります。これは、Windows 検索の標準のワード ブレーカーとステマーが異なるアルゴリズムを使用していることを理解しているためです。

2 つの dll (infosoft と langwrbk) を SQL Server のインストールからプログラムを実行しているマシンにコピーし、それらで regsvr32 を実行すると、レジストリにインストールされ、使用できるようになると思いました。彼ら。

そのような運はありません - regsvr32 を実行しても、レジストリには何も追加されないようです!

Windows に付属のワード ブレーカーとステマーで機能するコードがあり、動作しますが、違いが心配です (ここの他の投稿で不満を述べているのを見ました)。

0 投票する
1 に答える
1104 参照

sql - ワード ブレーカーを使用しない SQL2008 全文インデックス検索

@username などの Twitter スタイルのユーザー名を使用して FTI を検索しようとしていますCONTAINSが、ワード ブレーカーは @ 記号を無視します。ワード ブレーカーを無効にする方法はありますか? 調査によると、カスタム ワード ブレーカー DLL を作成し、それをインストールして割り当てる方法がありますが、それは少し集中的で、率直に言って頭がいっぱいです。ダッシュが無視されないようにストップ ワードを無効にしましたが、その @ 記号が必要です。何か案は?

0 投票する
3 に答える
3216 参照

sql-server - SQLサーバーの全文検索:英語のデフォルトのワードブレーカーは何ですか?

SQL サーバーの全文検索で英語の既定のワード ブレーカーのリストはどこにありますか?