Ruby 1.9 Unicode Regexp

Jako że lopex śpi i nie ma kogo zapytać walne tutaj:

Ruby 1.9.2p180:

irb(main):004:0> "ł".scan(/\w/u) => [] irb(main):005:0> "ł".scan(/\p{Word}/u) => ["ł"]
Z http://www.geocities.jp/kosako3/oniguruma/doc/RE.txt wynika że:

[code] \w word character

       Not Unicode:
         alphanumeric, "_" and multibyte char. 

       Unicode:
         General_Category -- (Letter|Mark|Number|Connector_Punctuation)[/code]

Natomiast z unicode 1.1:

Jeśli ł to Lower Letter które w zasadzie należy do General Category to dlaczego Oniguruma tego nie łyka ?

Dobra, do dokumentacji onigurumy lepiej nie zaglądać.

http://trans.github.com/ruby/core/Regexp.html

/\w/ - A word character ([a-zA-Z0-9_])