問題タブ [finite-state-automaton]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
23 参照

data-representation - 文字語彙が限られている場合、任意の長さの文字列を均一な長さで表現する最も簡単な方法は何ですか?

プロジェクトで有限状態変換器を操作しようとしています。ただし、FST を構築する際には、入力シンボルからの任意の長さの文字シーケンスを出力シンボルにする必要があります。これは、関連するテキストのコーパスからの個々の一意の文字にすぎません。さらに、各組み合わせの表現が同じ長さになるように、これらの任意の長さのシーケンスを均一に表現する必要があります。もちろん、任意の長さの場合、可能な最長の組み合わせは無限の長さになるため、関連するコーパスからの最長のドキュメントよりも長い組み合わせはあり得ないと仮定しましょう。

言い換えると、input_vocabularyofが与えられた['a', 'b', 'c']場合、output_vocabularyof['a', 'ab', 'acb', 'abcb']はそれぞれ、長さ 4 のベクトルとして表され、各ベクトルの各項目が からの項目である必要がありますinput_vocabulary[ [0, 3, 3, 3], [0, 1, 3, 3], [0, 2, 1, 3], [0, 1, 2, 1] ]私の唯一のアイデアは、この例では のようなパディングされたベクトルを使用する3ことですが、私はこれに非常に慣れていないので、どんな助けも大歓迎です。

明確にするために、パッドトークンなしでこれを行う方法があるかどうか知りたいです。

0 投票する
1 に答える
62 参照

python - 単語の最初の文字に基づいて出力を生成する

Python 用の Helsinki Finite State Technology (HFST) を使用して、Finite State Transducer をセットアップしようとしています。

単語の最初の文字が「o」の場合、出力は「ポジティブ」になり、同じ単語に続く文字がある場合は、正規表現を使用してすべての文字を空に出力します。
ただし、「お」だけは受け付けません。

HFSTチュートリアルからこれまでに得たもの: