問題タブ [word-count]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
2013 参照

hadoop - ファイルの単語数の一般的な単語

Hadoopの単語数の例を非分散モードで実行することができました。「part-00000」という名前のファイルで出力を取得します。すべての入力ファイルを組み合わせたすべての単語が一覧表示されていることがわかります。

単語数コードをトレースした後、行を取り、スペースに基づいて単語を分割していることがわかります。

複数のファイルで発生した単語とその発生を一覧表示する方法を考えていますか?これはMap/Reduceで実現できますか?-追加-これらの変更は適切ですか?

0 投票する
1 に答える
8845 参照

bash - 単語数の検索結果を変数に入れます

これにより、txtファイルの数がわかります。私のプログラムでは、この出力を「カウント」という変数に入れるにはどうすればよいですか。

0 投票する
2 に答える
2374 参照

hadoop - hadoop mapreduce を使用したファイル内の相互単語

複数のファイルに存在する単語を「のみ」リストできるコードを実行しようとしています。私がこれまでに行ったことは、wordcount の例を使用することでした。Chris White に感謝し、なんとかコンパイルできました。コードを機能させるためにあちこちを読んでみましたが、得られるのはデータのない空白のページだけです。マッパーは、各単語とそれに対応する場所を収集すると想定されています。レデューサーは、一般的な単語を収集することになっていますが、何が問題なのかについての考えはありますか? コードは次のとおりです。

何か不足していますか?大変お世話になりました...私のHadoopバージョン:0.20.203

0 投票する
2 に答える
3765 参照

hadoop - Hadoop ワードカウントの例の実行時にジョブ トークン ファイルが見つからない

Hadoop を小さなクラスターに正常にインストールしました。今、ワードカウントの例を実行しようとしていますが、次のエラーが発生しています:

何か助けはありますか?

0 投票する
2 に答える
1138 参照

c# - リッチテキスト ボックスからラベルまで単語をカウントできませんか?

ここで何が問題なのかわかりませんが、リッチテキスト ボックス内の単語を数えて、それをラベル付きで表示しようとしています。

タブ付きのテキスト ボックスを使用できるように、リッチテキスト ボックスをタブ コントロールに配置しました。これは、これを本来よりもはるかに難しくしているようです

また、これはプログラム全体ではありません。リッチテキストボックスとワードカウンターに関連する部分を取り上げました

どんな助けでも大歓迎です:)

0 投票する
2 に答える
893 参照

c - K&R1.5.4Cでの単語カウント

私は新進のCプログラマーであり、第2版K&R1.5.4の単語を数えるためにこのプログラムを作成しました。私のifステートメントに何か問題がありますか?コードは、最初のテストを満たしていないため、変数をインクリメントすべきではないときにインクリメントするように見えます。

これにより、次のようになります。

私が変更したK&Rコード:

K&Rコードの結果は次のとおりです。

最初のifステートメントのテストに適合しない場合、コードが「Hello」の後の2番目のスペース(0x20)を処理しているときに、どのようにしてword / nwをインクリメントできますか?2番目のifステートメントに到達したとしても、「state」変数を1(IN)に設定すると思います。ここで重要な何かが欠けています。私は与えられたどんな助けにも大いに感謝します。ありがとうございました。

0 投票する
4 に答える
1276 参照

java - Javaを使用してテキストファイル内の単語の頻度を数える方法は?

大きなテキストファイル(1Gをはるかに超えるサイズ)があり、Javaを使用してそのファイル内の特定の単語の出現をカウントしたいと思います。ファイル内のテキストは1行で書かれているため、1行ずつ確認できない場合があります。この問題に取り組むための最良の方法は何でしょうか?

0 投票する
1 に答える
241 参照

c++ - c++でmsword97-2003 docファイルの単語を数える方法は?

COMを少し習得したばかりですが、VBAプログラミングはMSが提供するCOMコンポーネントに基づいていることを知っています。しかし、c ++プログラム用にタイプライブラリなどをインポートする方法がわからないため、c++を使用してOfficeをプログラミングする方法がわかりません。これがドキュメントファイルの単語を数えるための私のコードですが、失敗しました。ありがとう、私がそれを修正するのを手伝ってくれませんか。

0 投票する
1 に答える
2246 参照

python - Python - マルチスレッドの単語/行数

Python でのマルチスレッド処理を理解しようとしています。単語数、テキストの行数を計算し、各単語の数で辞書を作成する作業コードがあります。コードのコメントに記載されているような小さなファイルで高速に実行されます。ただし、通常は glob を使用して複数のファイルを取り込みます。私がそうすると、実行時間が大幅に増加しました。一方、私のスクリプトはシングル スレッドだったので、他の 3 つのコアがアイドル状態にあり、1 つが限界に達していることがわかります。

私はpythons multithreadingモジュールを試してみようと思った.

このコードを試してみても、うまくいきません。入力ファイルをチャンクに分割し、何らかの方法で出力をマージする必要があると思います。? マップ/リデュース? おそらくもっと簡単な解決策がありますか?

編集:

たぶん次のようなもの:

  1. ファイルを開き、
  2. それをチャンクに分割します
  3. 各チャンクを異なるスレッドにフィードする
  4. カウントを取得し、各チャンクで辞書を作成します
  5. マージ数 / dict
  6. 結果を返す
0 投票する
3 に答える
3177 参照

php - 中国語/日本語およびその他のアクセント付き言語を含む効果的な単語カウンターの作成

文字列の効果的な単語カウンターを作成する方法を理解しようとした後、PHPが持つ既存の関数について知っていますがstr_word_count、残念ながら、英語を含む単語の数を数える必要があるため、必要な機能を実行できません。 、中国語、日本語、その他のアクセント付き文字。

ただしstr_word_count、3番目の引数に文字を追加しない限り、単語数はカウントされませんが、これは非常識です。中国語、日本語、アクセント付き文字(など)の言語ですべての文字を追加する必要がある可能性がありますが、これは私が行うことではありません。必要。

テスト:

とにかく、私はこの関数をオンラインで見つけました、それは仕事をすることができました、しかし悲しいことにそれは数えられません:

テスト:

基本的に、すべての一般的な単語/アクセント付き/言語記号から単語をカウントできる、UTF-8でサポートされている優れた単語カウンターを探しています-これに対する可能な解決策はありますか?