今度は String Tokenizer がユニコード文字列を無視する件


エクステ絡みのトラブルは文字列絡みが多すぎる。これはもともと SDK レベルでユニコードに長く対応して来なかったツケというか、後付設定のせいだ。


実際に複雑怪奇な C の文字列型のせいで IDE から延々とエラーとか警告とか受け取るのは精神的に禿げる。しかし最近問題が発生するたびに自分でエクステ作るわけだが、文字列絡みで ToLoveる ったら自分で作ったほうが対応マジ速い。

String Tokenizer の実装を考える

要するに文字列を受け取ったらデリミタ指定して二次元配列以上で配列を動的に確保すればええんやろ?

String Tokenizer の仕様だと二次元配列までで良い。二次元配列の場合はデリミタを二つ指定。配列の上限については仕様が書かれてなかったので分からない。

String Parser 2 でも似たことはできる(あるいはバイナリオブジェクトでも)はずだが、あれも文字列型はおそらく Char で確保されいるためユニコードに対応できてないと思う。日本語文字列を完璧にとは言わないけど、ユニコードに対応した SDK 出してるなら文字列扱うオブジェクトで標準機能的なものはちゃんと動作確認してから出して欲しいわけで。

エクステのソースコードがあれば直接手を入れて治せるレベルなんだけど開示されてないので治せない。なんとかならんのかこれ。

Leave a comment

メールアドレスが公開されることはありません。 が付いている欄は必須項目です