呼び出しごとに最大 8 KB のテキストを受け入れるZemanta APIを使用しています。JavaScript を使用して Web ページから Zemanta に送信するテキストを抽出しているので、テキストを正確に 8 KB に切り詰める関数を探しています。
Zemanta はこの切り捨てを独自に行う必要があります (つまり、より大きな文字列を送信する場合) が、API 呼び出しを行う前にこのテキストを少し移動する必要があるため、ペイロードをできるだけ小さく保ちたいと考えています。
8 KB のテキストが 8,192 文字であると仮定して、それに応じて切り捨てても安全ですか? (1 文字あたり 1 バイト、1 KB あたり 1,024 文字、8 KB = 8,192 バイト/文字) または、それは不正確ですか、それとも特定の状況でのみ当てはまるのでしょうか?
実際のファイル サイズに基づいて文字列を切り詰めるよりエレガントな方法はありますか?