問題タブ [hyphenation]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
17 に答える
74780 参照

nlp - 単語の音節の検出

単語の音節を検出するかなり効率的な方法を見つける必要があります。例えば、

目に見えない -> in-vi-sib-le

使用できる音節規則がいくつかあります。

V CV VC CVC CCV CCCV CVCC

※Vは母音、Cは子音です。例えば、

発音 (5 Pro-nun-ci-ation; CV-CVC-CV-V-CVC)

私はいくつかの方法を試しましたが、その中には正規表現 (音節を数えたい場合にのみ役立ちます) またはハードコードされたルール定義 (非常に非効率的であることが証明された力ずくのアプローチ) を使用し、最後に有限状態オートマトン (これは有用なものにはなりません)。

私のアプリケーションの目的は、特定の言語のすべての音節の辞書を作成することです。このディクショナリは、後でスペル チェック アプリケーション (ベイジアン分類子を使用) およびテキストから音声への合成に使用されます。

以前のアプローチ以外に、この問題を解決する別の方法についてのヒントを教えていただければ幸いです。

私は Java で仕事をしていますが、C/C++、C#、Python、Perl のヒントなら何でも役に立ちます。

0 投票する
3 に答える
10840 参照

latex - LaTeXでクラス名を表現するには?

LaTeXドキュメント(ソフトウェアについて書いている)でクラス名を表現する最良の方法は何だと思いますか.

私は現在\texttt(等幅タイプライトフォント)を使用していますが、それ以外の場合は正常に機能しますが、クラス名が余白を「超えて」しまいます。

だから、私はどちらかを求めています

  • クラス名を表す別の (見栄えの良い) 方法
  • クラス名がマージンを超えないようにする方法

br, トウコ

0 投票する
2 に答える
2483 参照

latex - TeXハイフネーションパターン : それらは何を表していますか

このページを少し下にスクロールすると、次のような英国英語のハイフネーション パターンが表示されます。

.ab4i のようなこれらのパターンはどういう意味ですか?

0 投票する
6 に答える
13564 参照

html - nbsp の反対語は何ですか?

文字 とは、改行を許可しないスペースです。

その反対は何ですか?つまり、スペースとしてレンダリングされないが、改行に使用できる文字です。

私はソフトハイフン文字を認識していますが、私の目的のために、区切りにハイフンを追加したくありません.

0 投票する
2 に答える
22492 参照

latex - \textttLaTeXタグがそのコンテンツをマージンを超えさせないようにする

私のレポートでは、段落内にいくつかのクラス名または変数名を記述しており、これらの名前を等幅フォントでレンダリングしたいと考えています。

例:

\ textttタグ内の単一の単語が行の終わりにレンダリングされると、その単語は次の行に移動せず、その単語にも切れ目がない場合があります。単語の終わりが余白を超えます。

そのような場合はどうすればよいですか?

乾杯。

0 投票する
9 に答える
131479 参照

latex - LaTeX にダッシュを含む単語をハイフネーションさせるにはどうすればよいですか?

私が書いている LaTeX ドキュメントでは、たまたま行末にレンダリングされる「複数分野」という単語が原因で、hboxがいっぱいになるという警告が表示されます。

この特定の警告は に変更することで取り除くことができますmulti-discipli\-naryが、この単語は論文で頻繁に使用されているため、同じ問題が他の場所でも発生します。

\hyphenation{}代わりにコマンドを使用したいのです\hyphenation{multi-disci-pli-na-ry}が、最初のダッシュを正しく理解していないため、明らかに私の暫定的なものは機能しません。

すでにダッシュが含まれている単語を正しくインデントするには、どの呪文が必要ですか?

おまけの質問: その質問に対する答えを自分でどこで見つけることができたでしょうか?

0 投票する
4 に答える
3307 参照

latex - MikTeX 2.8は、pdfLaTeXのハイフネーションサポートを追加しません

MikTeX 2.8エディションを使用しており、ハンガリー語のサポートファイルとハイフンファイルをインストールしました。標準のLaTeXコマンドを使用すると正常に動作しますが、pdfLaTeXを使用しようとすると、ロードされず、

メッセージ。ラテックスを使用すると、正常に機能します。

FNDBとフォーマットを更新しようとしましたが、役に立ちませんでした。

0 投票する
1 に答える
448 参照

actionscript-3 - sIFR を AS3 に変換できる人はいますか (ハイフネーションとコンバーターの助けを借りて)?

sIFR で多く求められることの 1 つは、ハイフネーションです。

今、私は Hyphenator.as http://vis4.net/blog/2010/05/as3-hyphenation/を統合することでほぼ解決しました。

唯一の問題は、Hyphenator.as が AcionScript 3 で記述されているのに対し、sIFR は ActionScript 2 で記述されていることです。

AS2 から AS3 へのコンバーター www.5etdemi.com/blog/archives/2006/11/as2-to-as3-converter-createtextfield-geturl-handling/ を見つけましたが、結果の examples.bezel.be/sIFR-as3.as はまだ動作していません。

sIFR でハイフネーションを機能させることに貢献できる人はいますか?

(リンクで申し訳ありませんが、奇妙なことに、私はリンクを 1 つだけ投稿することを許可されています。本当に奇妙です。)

0 投票する
1 に答える
359 参照

browser - オプションのハイフンを無視してチェックワードをスペルチェックするにはどうすればよいですか?

ブラウザでのテキスト作成にRTE(TinyMce)を使用しています。RTEは、非表示のオプションのハイフン(コード:''または'\ u00ad')を、ユーザーが書き込むときのハイフンの最小長の単語に挿入しています。

私が今得た問題は、文字だけでなくオプションのハイフンで構成されていても、単語をチェックできるスペルチェッカーを見つけることです。「金魚」という単語をチェックすると、「金」と「魚」の間のオプションのハイフンの2つの単語の原因と見なされるスペルチェッカーしか見つかりませんでした。

それらを無視するために何らかの方法で変更できるスペルチェッカーはありますか?そのようなソフトハイフンを無視するようにスペルチェッカーを構成する方法はありますか?(ソリューションはオープンソースである必要はありません。)

辞書に単語を追加することはオプションではありません。

このソリューションは、SafariまたはFireFoxで機能するはずです。

0 投票する
1 に答える
202 参照

nlp - アルファベット以外の文字を含む単語の音節の検出

私は可読性テストを実装しており、音節を検出する単純なアルゴリズムを実装しています。母音のシーケンスの検出私はそれらを単語で数えています。たとえば、単語「shoud」には「ou」という母音のシーケンスが1つ含まれています。それらを数える前に、-les、-e、-ed などの接尾辞を削除します (たとえば、「like」という単語には 1 つの音節が含まれていますが、母音のシーケンスが 2 つ含まれているため、この方法は機能します)。

しかし...これらの単語/シーケンスを検討してください:

  • X線(2音節を含む)
  • I'm (一音節、テキスト中のすべてのアポストロフィを削除してもよいでしょうか?)
  • 入る'
  • 私はしただろう
  • n' (例: Pork n' Beans)
  • 3番目(これをどのように処理するのですか?)
  • 12345

特殊文字はどうする?それらをすべて削除しますか?ほとんどの単語には問題ありませんが、「n'」や「x-ray」には問題があります。そして、サイファーをどのように扱うか。

これらは言葉の特殊なケースですが、この主題に関する経験やアイデアを見てとてもうれしく思います.