utf8 文字列を処理する小さな C ライブラリを探しています。
具体的には、ステミング アルゴリズムで使用するための Unicode 区切り記号に基づく分割です。
関連する投稿は次のことを示唆しています:
ICU http://www.icu-project.org/ (組み込みデバイスでの目的には大きすぎることがわかりました)
UTF8-CPP: http://utfcpp.sourceforge.net/ (優れていますが、C++ ではありません)
ユニコード文字列を処理するための、プラットフォームに依存しない小さなコードベース ライブラリを見つけた人はいますか (帰化を行う必要はありません)。