元の文字列を使用して、英語の文のバリエーションを生成したいと思います。文法的に正しい文を維持するために、いくつかの基本的な検索と置換を行うことができることを私は知っています。しかし、文のより複雑な言い換えを行う方法はありますか?
たとえば、「猫が犬を見ている」という文を考えて、「猫が犬を見つめている」「猫が犬を見ている」を考えたいと思います。申し訳ありませんが、賢い例を思い付くことができません!
Microsoft の「パラフレーズ」API を見つけました。何とか使えそうです…
一般に、自然言語は、正規表現で捉えることができるよりも複雑なタイプの文法です。したがって、一般的に答えはノーです。一方、必要なスコープが十分に制限されている場合は、正規表現で十分かもしれません。ただし、あまり汗をかくつもりはありませんが、基本的には限定的な解決策になります。
さらに多くのことができるツールキットについては、NLTK (Python のみ) をチェックしてください。
正規表現が自然言語での使用が制限されている理由の背景については、Wikipedia の Chomsky Hierarchy を参照してください。英語は少なくとも文脈自由言語であると推測されます。