Też to zauważyłem, między innymi w tym wątku: http://rubyonrails.pl/forum/t1842-Thinking-sphinx---ignoruje-polskie-znaki
Rozwiązanie:
http://yob.id.au/blog/2008/05/08/thinking_sphinx_and_unicode/
Testowałem, faktycznie działa.
@hosiawak: dzięki za info!
Jeśli bym chciał dokładnie odwzorować polskie znaki, to jak zabrać się za tą tablicę …?
Miałem 2GB przestrzeni, jak odpaliłem indeksowanie 2,7mln słów/rekordów to okazało się to za mało!
Witam.
Czy można skonfigurować ferreta tak, aby szukał polskich znaków?
Ogólnie chodzi mi o to, aby uzyskać efekt:
wpisuję “szóstą”, klikam szukaj, i w wynikach pojawia mi się produkt z opisem “szóstą”
Obecnie ferret szuka tylko po niepolskich wyrazach
[quote]Dawno nie benchmarkowałeś obu, co? wink
Generalnie Ferret jest teraz szybszy niż swoja protoplasta, czyli javowy Lucene (!).[/quote]
Nie polecam Ferreta! Wygląda na to że teraz coś w rozwoju się ruszyło, ale pół roku temu można by go określić mianem “abandonware”. Wiki/trac nie działało, grupa dyskusyjna była martwa a sam ferret nie chciał działać z nowymi wersjami bibliotek… (już nie pamiętam których). Skończyło się przesiadką na Sphinxa w 2 projektach i zycie stało się prostsze. Nawet jeśli jest trochę wolniejszy…
Obecnie ferret (i acts_as_ferret) działa rewelacyjnie i jest jak najbardziej aktualny. Polecam, zwłaszcza że do Sphinxa nigdy się do końca nie przekonałem
Dobrze wiedzieć! Może dam mu kolejną szansę
A radzi sobie dobrze z cyrylicą, pliterkami i innymi znaczkami specjalnymi alfabetów “łacińskopochodnych”?