技術記事以外

技術記事以外の振り返りやその日学んだことのちょっとしたメモなどを置く予定です

今日の学習メモ

GitHub - tc39/proposal-intl-segmenter: Unicode text segmentation for ECMAScript

ちょうど文章を単語ごとにくぎりたいことがあってどうしようかと思っていたところにすごいものを見つけた。Chromeではもう使える!ああでもこれSafariでも動かさないといけないんだった…Oh…実装してみてモジュールのサイズに見合うようならポリフィルかなあ

と思ってポリフィル試したけど、なぜか日本語だけうまくいかない。句読点では分割されるけど単語単位にならない。ICUのデモではできているからICUのデータの取捨選択がうまくできていないか、Intl.Segmenterのポリフィル側のbreak_iterator側の実装に何かがある?(見た限りICUのメソッド呼ぶだけだからそんなことはないと思うんだけど…) デフォルトでバンドルされているタイ語の辞書を外すとタイ語は分割されなくなるから、filter.jsonの使い方は間違っていないはずなのだが全くわからず、一旦諦め。