0

私は、人々が自分の文書を翻訳するために翻訳者を注文できる翻訳者サイト(PHP)を作成しようとしています。サイトから人々は自分のファイルをアップロードすることができ、それからそれはサイトの翻訳者/メンバーに接続されます。問題は、ドキュメントから価格をカウントするアプリケーションをどのように作成するかです。

翻訳価格を評価する最も一般的な方法は、単語ごとです。したがって、顧客がアップロードしたドキュメント内の単語の数を知る必要があります。単語文書などのテキストファイルから単語を数えることができるはずだと思いました。ただし、ms word 2003ドキュメント(.doc)の正確な量を取得する方法が見つかりませんでした。.docxをカウントする方法を見つけましたが、.docはカウントしません。そして、PDFやrtfなどのファイルがさらに増えるでしょう。

ファイルサイズのみをカウントする別の方法を見たことがありますが、異なるドキュメント形式で同じ結果が得られるとは思いません。それともそうですか?私が考える簡単な方法は、訪問者にテキストをコピーしてテキストエリアに貼り付けるように依頼することですが、これが最善の方法ではないと思います。

誰かが私にこれを解決するためのアドバイスをくれますか?

4

1 に答える 1

0

*nix サーバーでサイトを実行している場合は、次のことを試してください。

$word_count = system("wc -w " . $filename);

そして、はい、それが .doc および .docx ドキュメントで機能すると信じるようになりました。PDF はまったく別の話です。私はそれを研究する必要があります。

于 2012-12-15T21:08:00.363 に答える