Matching system

rafau · September 6, 2014, 9:05am

Witajcie

Załóżmy, że jest bardzo prosta aplikacja:
User może odpowiadać na pytania (tylko TAK lub NIE).

W jaki sposób zorganizować wyciąganie userów, którzy w największym stopniu odpowiedzieli tak samo na pytania jak ja?

Nie wystarczy zliczać odpowiedzi userów (np User1 miał 5 odpowiedzi na TAK i 3 na NIE) ponieważ kolejność odpowiedzi ma znaczenie.

Jak byście ugryźli ten problem?

sledzias · September 6, 2014, 9:07am

Wykorzystaj odległość Hamminga (zakładam, że każdy użytkownik odpowiada na ten sam zestaw pytań)

rafau · September 6, 2014, 9:18am

Brzmi sensownie.
Ale czy sprawdzi się dla różnych ilości odpowiedzi udzielonych przez użytkowników?

sledzias · September 6, 2014, 9:26am

Nie bardzo rozumiem, może napisz jakiś przykład odpowiedzi i tego co chcesz osiągnąć.

rafau · September 6, 2014, 9:34am

User1 odpowiedział: T, T, T, N, T, N, N
User2 odpowiedział: T, T, T, N, T
User3 odpowiedział: N, T, T, T, T, T

User1 i User2 zgadzają się w 100%
User1 i User3 zgadzają się w 50%
User2 i User3 zgadzają się w 60%

mrgoodkat · September 6, 2014, 10:56am

Porownaj tylko te pytania na ktore masz odpowiedzi

rafau · September 6, 2014, 11:08am

W porównaniu 1 do 1 usera sprawa jest prosta. Co jeśli np jest 100 000 użytkowników i current user chce poznać kto odpowiedział w najbardziej dopasowany do niego sposób?

mrgoodkat · September 6, 2014, 11:41am

http://pgsimilarity.projects.pgfoundry.org/ - to ci sie moze przydac

ronin · September 6, 2014, 1:36pm

Polecam książkę http://shop.oreilly.com/product/9780596529321.do

Jest tam opisany ten problem i różne sposoby na rozwiązanie + przykładowy kod w pythonie.

Wacaw · September 8, 2014, 10:11am

szukasz tego: https://github.com/maccman/acts_as_recommendable/ w tym gemie autor skorzystał z korelacji Pearsona. Użyłem kiedyś tego, sprawdziło się.

http://dev.szczesniak.luczak.it/prezentacja.pdf

Jak uda mi się szybko podpiąć certyfikat to nawet appka ruszy (fb wymaga https’a).

rafau · September 8, 2014, 10:25am

Wielkie dzięki!
Skorzystam na pewno.