Witam,
Pobieram stronę w iso8859-2 klasą Net::HTTP.get_response(URI.parse(url)) i niestety polskie znaki się sypią. Dałbym radę nawet bez polskich znaków, ale .gsub(/[^[:alnum:]]/, ‘’) nie działa tak jak należy (dla niektórych ogonków usuwa polski znak i następujący po nim). Co należy zrobić aby strona była interpretowana poprawnie?
Co to znaczy że znaki się sypią? Powinieneś dostać w odpowiedzi dokładnie taki tekst jaki jest pod wskazanym adresem i jeśli się nie mylę kodowanie nie ma tutaj większego znaczenia dla rubiego (po prostu ciąg bajtów).
Wejdź na stronę: http://rozklady.mpk.krakow.pl/aktualne/0004/0004t059.htm i ustaw w przeglądarce kodowanie utf-8. Właśnie coś takiego widzi rails, a ja nie jestem w stanie tego normalnie przetwarzać. Np.: “Elektromonta�” != “Elektromontaż”
Dopiszę tu jeden problem, który mnie ostatnio nawiedził, otóż korzystając z slugalizera zauważyłem, że gubi nasz “ł”, a dokładniej railsowe multibyte, spotkał się ktoś z rozwiązaniem tego problemu?
A jak to widzisz z rails2.2, próbuję tu zrobić coś z seo-urlami, mieszam metody, wykorzystuje wtyczki i ciągle “ł” jest gubione, pod platformą unixową i windowsem, nie wiem gdzie już szukac.