Szukam materiałów dot. programowej odmiany polskich słów przez liczby i przypadki.
Ze słowa “samochód” (mianownik, l.poj) chciałbym zrobić “2 samochody”, “5 samochodów” i “pół samochodu”.
To samo z wyrażeniem “serek homogenizowany”.
Chodzi o rozwiązanie wymagające podania tylko formy podstawowej.
Na tą chwilę wydaje mi się to niewykonalne (czyt. na tyle trudne że nie ma sensu). Ale może nie jest.
Dajcie znać jeśli macie jakieś materiały - zarówno za i przeciw - kody, linki, researche.
Wyobrażam sobie coś na wzór railsowych inflections.rb, czyli sporo regexów - odpowiadających końcówkom słów - i ich odwzorowania na pozostałe formy.
Na pewno nie będę chciał tych wszystkich przypadków wyszukiwać i tworzyć sam.
Wydaje mi się, że ktoś mógł coś podobnego już kiedyś robić - może w innych językach - i tego szukam.
Mierzyłem się z tym kiedyś na studiach gdy budowałem bota tworzącego zdania. Niestety w języku polskim wydaje się być więcej nieregularności niż regularności. Najlepszym rozwiązaniem jest zbudowanie lub użycie gotowego słownika, z odpowiednimi flagami dla słów. Na potrzeby aplikacji możesz śmiało użyć i18n, opisałem coś takiego tutaj: http://blog.baael.pl/i18n-i-polska-liczba-mnoga. Jeśli interesują Cię bardziej zaawansowane rozwiązania to na necie jest ich kilka, nie pamiętam nazw, ale licz się z gigantycznymi bazami słów i raczej nie najszybszym działaniu.