問題タブ [sentence]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
machine-learning - テキストからアクションを抽出するためのNLP
誰かが私を正しい方向に向けて、一連のテキストからアクションを分離することについて学ぶことができることを願っています。
私がこのテキストを持っているとしましょう
私はそれを分割させようとしています
特にアクションベースの検索では、何も見つかりませんでした。たとえば、2番目の項目に「go」、「pick-up」、「get」があるなど、1つのアクションに関連付けられることがある複数の動詞があるため、動詞を選択するよりも賢くする必要がありますが、それはすべて一部です単一のアクションの。もちろん、「ティムの飛行」は、動詞がセグメントの終わりに向かってくる、現在分詞での行動を示唆するだけです。
この種のことをどこで行うべきかについての提案はありますか?注意点、推奨読書など。
python - 文字列文のリストを単語に変換する
私は基本的に、次のような文を含む文字列のリストを取得しようとしています:
それを次のように変換します。
私はこれを使ってみました:
各文字列を取り、その文字列の各項目を word_list に追加すると思いましたが、出力は次の行に沿ったものです。
愚かな間違いを犯していることはわかっていますが、理由がわかりません。誰か助けてもらえますか?
java - 文章をデータベースに保存する
これが可能かどうかはわかりませんが、Androidアプリから送信された後、MySQLデータベースに文を保存できるようにしたいと考えています。私のアプリには、ユーザーが説明(文)を入力できるフィールドがあり、ユーザーが[送信]を押すと、説明とともにすべての個人情報がデータベースに送信されます。個人データの送受信はすべて行っていますが、文が機能していません。これを行う方法はありますか?BLOBを使用してみました[BLOB-4B]
が、表のように表示されます。私は初心者なので、優しくしてください。ありがとう!
java - 文中の単語とその開始位置を格納するデータ構造の選択
私は面接の準備をしていますが、よくある質問の 1 つに次のようなものがあります。
単語と単語の最初の文字のインデックスに分解された文 (例: The song is the best song) が表示されます。つまり、"the" - 0, 12; 「歌」 - 4,21; 「は」 - 9; 「最高」 - 16; この情報を格納するデータ構造を選択し、そのデータ構造を使用して文を再構築します。
私の最初の試みは、キーが単語で、値が位置の配列であるハッシュマップに単語を格納することです。これは完全に実行可能ですが、ネストされた for ループと境界インデックスでの厄介な問題、適切な場所のスペースの読み取りなどで非常に複雑になります。
私はそれ用のコードを作成したので、誰かが見たい場合は投稿します(長くてリベットで読むことができます!!)
とにかく、私の質問に: 誰かがデータを表現して再構築するより効率的な方法を提案できますか? 別の方法を試してみたいのですが、これが今のところ私が思いついたすべてです
c# - 各文の最初の文字を大文字にし、ユーザーに文字を小文字に変更する機会を与える方法は?
句読点の後に大文字を実装しました。しかし、小文字で続けたいので、ユーザーが戻って最初の単語または文字を削除できるようにするにはどうすればよいでしょうか?
例:私がこの文章を書くとします。戻って「私」を「私」に変えることはできません!そして、「A」を「a」に変更することはできませんが、変更したいのです! これをどのようにコーディングするのですか?
サンプルプロジェクトはこちら: http://www.filefactory.com/file/3ecbn51bhbrv/n/Capi.zip
私が見る唯一の解決策は、現在と前のキーを保存し、バックスペースまたは削除が次のように押されたかどうかを確認することです。
python - nltkpythonで同じ文から2つの名前を抽出する
こんにちは私は最近Pythonで遊んでいましたが、簡単そうなので、Pythonのnltkでコーパスを見つけました。試してみたとき
それは私に文の数とMobyという単語を含む文の表示を与えてくれました、かっこいい。
そこで、MobyとAhabという名前のすべての文を見つけることができるかどうかをテストしようとしましたが、残念ながら、エラーが発生します。
私は何か間違ったことをしていますか、それとも両方の名前を含むすべての文を取得できる必要がありますか?nltkから使用すべき別の関数はありますか?Oo
おそらく簡単ですが、私がそれを見るのはそれほど簡単ではありません...誰かが助けてくれることを願っています、ありがとう。
PS:コードを書く必要があるなら、例がいいでしょう。^^
編集:誰かがエラーを求めたので、私も書いたコードを書きます。
エラーが発生します:
私はちょうど走っているようないくつかの試合を得るだろうと推測していました:
ここで84試合がありました。
forms - フォームから文を生成する方法を教えてください。
ユーザーがフォームに入力します。フォームのテキストを使用して、プログラムが自動的に文章を生成します。
例えば:
[enter name]
の である[student/professor]
は、に関する研究で[enter name of university]
の賞を受賞しました。で賞が授与されました。この会議には、世界中から著名な科学者が参加しました。[enter award]
[name of topic]
[name of conference]
[name of country]
生成されたテキストは次のようになります。
ペトロナス工科大学の学生であるムハンマド・アフィクは、石油パイプラインのルーティングに関する研究で優秀賞を受賞しました。この賞は、マレーシアで開催されたグリーン テクノロジー会議で授与されました。この会議には、世界中から著名な科学者が参加しました。
これを行う方法を学ぶために使用できるテクノロジーまたは言語を知っていますか? 私はジャーナリストです。そこで、書きたくないときにフォームに入力できるようにする簡単なプログラムを設計する方法を探しています。
私はいくつかの Python を知っていますが、それを使用してこのプログラムを作成することはできませんでした。これまでのすべての検索 (このサイトを含む) は、NLP と AI で結果を返してきました。間違った検索用語を使用している可能性がありますか?
これを行う方法を学ぶことができる場所を教えてください。またはどこかにモジュールがありますか?
ありがとう。
編集:
Pythonを使用してこれを試しました:
うまくいきませんでした。
search - Lucene SpanQueries を使用した文認識検索
Lucene SpanQuery を使用して、「赤」、「緑」、「青」という用語がすべて 1 つの文に含まれる箇所をすべて見つけることはできますか?
私の最初の (不完全/不正確な) アプローチは、特別なセンテンス マーカー トークンとセンテンスの先頭をセンテンスの最初の単語と同じ位置に配置し、次のようなクエリを実行するアナライザーを作成することです。
もちろん問題は、それnextSentence
が実際には次の文ではなく、一致する文の中のものを含む任意の文マーカーであることです。termsInSentence
したがって、これは機能しません。
次のアプローチは、トークンを文の前(つまり、最初の単語と同じ位置ではなく、最初の単語の前) に配置するアナライザーを作成することです。これに関する問題は、 によって引き起こされる余分なオフセットを考慮しなければならないことですMY_SPECIAL_SENTENCE_TOKEN
。さらに、 USS Enterprise/\.\s+[A-Z0-9]/
を検索するときにすべての (偽の) 文マーカーを考慮する必要があるため、単純なパターンを使用して文を分割する (例: split on ) 場合、これは最初は特に問題になります。
では...どうやってこれにアプローチすればいいですか?