私はすでに PHP を使用してこのソリューションを自分で考え出しましたが、どうすれば別の方法で実行できるか興味があります。私が主に興味を持っている 2 つの言語は PHP と Javascript ですが、今日の他の主要な言語 (主に C#、Java など) でもこれがどれほど迅速に行われるかを知りたいと思います。
- X より大きい出現回数を持つ単語のみを返す
- Y より大きい長さの単語のみを返す
- 「and、is、the など」などの一般的な用語を無視する
- 処理の前に句読点を自由に削除してください (つまり、"John's" は "John" になります)。
- 結果をコレクション/配列で返す
エクストラクレジット
- 引用されたステートメントを一緒に保管してください(つまり、「彼らは明らかに「真実であるには良すぎる」でした」)「真実であるには
良すぎる」が実際のステートメントになります
エクストラエクストラクレジット
- 一緒に見つかる頻度に基づいて、まとめておくべき単語をスクリプトで判断できますか? これは、事前に言葉を知らずに行われます。例:
*「ショウジョウバエは医学研究において素晴らしい存在です。ショウジョウバエについては過去に多くの研究が行われ、多くのブレークスルーがもたらされました。今後もショウジョウバエの研究は続けられますが、私たちの方法は変わるかもしれません。」*
明らかに、ここにある単語は「フルーツ フライ」であり、簡単に見つけることができます。あなたの search'n'scrape スクリプトもこれを判断できますか?
ソーステキスト: http://sampsonresume.com/labs/c.txt
回答形式
- 操作がどれくらい続いたかに加えて、コードの結果、出力を確認することは素晴らしいことです.