Wracam do gry! Side projects czyli nowy pomysł na ten blog.

Hej. Zaczynam regularnie pisać ten blog. To spore wyzwanie, bo po małej życiowej rewolucji związanej z narodzinami córki, na wszystko brakuje mi czasu. Uczciwie trzeba przyznać, że na pisanie artykułów na datahacking.tech zawsze brakowało mi czasu. Nigdy nie było tu regularności. Do tej pory nie miałem jednak spójnego pomysłu na to, o czym chciałbym pisać. Pokaż całość

Zawód: Programista – wrażenia po lekturze.

Jestem po lekturze książki Macieja Aniserowicza (devstyle.pl) pt „Zawód: Programista”. Lektura nie jest przypadkowa. Sięgnąłem po nią, bo właśnie próbuję zostać zawodowym programistą. Do tej pory miałem do czynienia z programowaniem na potrzeby analizy danych. Teraz chcę nauczyć się pisania kompletnych aplikacji. We wpisie przeczytasz moje wrażenia dotyczące w/w książki.

Pokaż całość

Piłka nożna – regresja logistyczna

Drugi model też będzie łatwy w interpretacji, choć bardziej wymagający jeśli chodzi o przygotowanie danych. Głównie dlatego, że będziemy musieli pozbyć się silnie skorelowanych zmiennych oraz zdecydować się na jakiś sposób ich selekcji. Sprawdźmy, jak skuteczna okaże się regresja logistyczna.

Pokaż całość

Piłka nożna – modele bukmacherów

Piłka nożna to mało przewidywalny sport. O wyniku decydują bramki, których w porównaniu z innymi sportami pada niewiele. Często zdobywane są po błędach czy w wyniku przypadku. To wszystko powoduje, że żadnej drużyny nie można spisywać na straty jeszcze przed rozpoczęciem spotkania. Przewidywanie wyniku nie jest łatwym zadaniem. W tym wpisie sprawdzę jak radzą sobie z nim profesjonaliści czyli bukmacherzy. Będzie to też dobry benchmark dla tworzonych w przyszłości modeli. Przy okazji sprawdzimy też, który z bukmacherów ma najniższe marże.

Pokaż całość

Modelowanie wyników w piłce nożnej – dane i zmienna celu

Hej, jest to pierwszy z kilku artykułów, dokumentujących moje starania dotyczące zbudowania modelu statystycznego przewidującego wyniki meczów piłki nożnej. Ten post będzie opisywał ogólne założenia. Napiszę o danych, z których korzystam, wybiorę problem do zamodelowania i określę zmienną celu. W kolejnych wpisach sprawdzę, jak dobrze z przewidywaniem wyników radzą sobie bukmacherzy, a następnie kawałek po kawałku, zacznę budować własny model.

Pokaż całość