Ulubiony blog kulinarny Polaków w liczbach

Czy pamiętacie, co robiliście 25 września 2015 roku? Ja też nie. To był piątek, już raczej z tych bardziej jesiennych. Za oknami w części kraju padał deszcz, a słupek rtęci alkoholu z dużym trudem podciągał się do 20 stopni. Na świecie wydarzyło się całkiem sporo – od wizyty Papieża Franciszka w Stanach Zjednoczonych, przez rozwiązanie rady wojskowej w Burkina Faso, po trzęsienie ziemi w Indonezji. A w Polsce, właśnie tego dnia, na stronie aniagotuje.pl, pojawił się pierwszy przepis. Tak, dokładnie dekadę temu działalność zaczął blog kulinarny aniagotuje.pl, który stał się jedną z najpopularniejszych stron w tematyce gotowania dla polskojęzycznego kącika internetu.

Dzisiaj aniagotuje.pl to miejsce, któremu udało się wejść do masowej świadomości Polaków. Co może stać za jej sukcesem? Myślę, że tutaj wygrała prostota i cierpliwość. Zarówno dizajn strony, jak i same przepisy są proste, jak i wytłumaczone. Każdy, nawet taki, co wodę na herbatę przypali, będzie mógł pochwalić się kulinarnym sukcesem. A cierpliwość? Wejdźcie na sekcję komentarzy dla kilku przepisów. Zobaczycie, o co mi chodzi, jeśli jeszcze nie wiecie.

Zastanawiacie się teraz pewnie, co było pierwsze. W kontekście strony kulinarnej warto więc zapytać – jajko czy kura? Na pierwszy ogień, a właściwie grzałkę, poszło ciasto ze śliwkami. W tym przypadku pierwsze było jajko, a nawet cztery. Świetnie się składa – właśnie teraz jest sezon na śliwki, a więc wchodźcie, pieczcie i celebrujcie dekadę istnienia.

Jak słodko!

Pierwszy przepis pokazał, czym najbardziej aniagotuje.pl postanowi obdarować swoich czytelników w przyszłości. Dzisiaj bowiem wypieki i desery to największa i jedna z najpopularniejszych kategorii przepisów. Słodki kącik stanowi ponad jedną trzecią wszystkich receptur, a jest ich ponad dwa tysiące.

Jak wybrać najlepsze?

Naturalnie, przy tylu przepisach, ciężko jest wybrać ten jeden najlepszy. Na stronie nie znajdziemy nigdzie sortowania po najlepszej ocenie. Dlatego postanowiłem sam wybrać po 10 z trzech kategorii – dania główne, dania z mąki oraz wypieki i desery.

I wtedy pojawiło się pytanie – jak to zrobić?

Podejście pierwsze

Weźmy dwa przepisy. Jeden ma gwiazdek pięć, ale tak postanowiła tylko jedna osoba. Drugi za to ma ocenę niższą, bo w bezpośrednim porównaniu tylko 4,75. Natomiast tutaj zagłosowała cała populacja gminy Gorzyce w powiecie tarnobrzeskim, czyli niecałe 13 tysięcy. Gdybyśmy ułożyli przepisy według samej średniej arytmetycznej to pierwszy przepis nosiłby żółtą koszulkę lidera klasyfikacji, jak podczas corocznego kolarskiego wyścigu dookoła Francji. Czegoś jednak tu brakuje – pewności. Jak pewni możemy być, że ten przepis jest dobry? Jesteśmy bardziej skłonni uwierzyć, że uśredniona opinia wielu osób jest bardziej dokładna niż jednostki. Pojęcie mądrości tłumu podpowiada, że to drugi przepis powinien być oznaczony jako ten lepszy. Teraz tylko musimy wyrazić to matematycznie.

Podejście drugie

Drugie podejście to stworzenie prostej metryki, która będzie brała pod uwagę zarówno średnią głosów, jak i ich liczbę w postaci iloczynu.

$$Punkty = \text{Średnia ocena} * \text{Liczba głosów}$$

Podejście to faworyzuje przepisy, które mają wysoką liczbę głosów. Praktycznie taki sam ranking otrzymalibyśmy sortując po samej liczbie głosów. Czy to jest zły ranking? Nie, wręcz przeciwnie – myślę, że to jest naprawdę przyzwoity ranking, ale ma też swoje wady. Przepis, który ma średnią 2,5 gwiazdki z 5000 głosów będzie lepszy od przepisu, który ma ocenę 4,8 przy 2 tysiącach głosów. Tutaj na szczęście nie ma takiej sytuacji, lecz moją uwagę przykuło coś innego, o czym jednak o tym kawałek dalej.

Podejście trzecie

Podejście trzecie to próba implementacji podobnej miary, która jest używany w rankingach na takich stronach, jak Filmweb. Jest to rodzaj średniej ważonej, która nie uwzględnia tylko średnią głosów danego przepisu lub filmu, ale również średnią globalną. Działa tak, jakby do każdej pozycji dodać pewną liczbę $m$ pseudogłosów równych średniej globalnej. Dzięki temu przepisy z małą liczbą ocen nie mają zawyżonych wyników, a te z dużą liczbą mają wynik prawie taki sam, jak zwykła średnia. Parametr $m$ działa jak regularyzacja i może być dobierany na kilka sposobów. Ja wybrałem $m=3500$, ponieważ dał kompromis względem przepisów, które są popularne i tych, które mają zdecydowanie wyższą ocenę niż średnia, a mniej głosów.

$$\text{Ocena} = \frac{n}{n+m} \cdot x + \frac{m}{n+m} \cdot C$$

$n$ – liczba głosów
$m$ – próg
$x$ – średnia ocena przepisu
$C$ – średnia globalna wszystkich przepisów

Pięć gwiazdek dla wszystkich!

Czy zwróciliście uwagę, jaką ocenę miały te najlepsze przepisy? W szczególności patrzę na was, serniku, szarlotko, cieście ze śliwkami i inne pyszne wypieki. Każdy z nich ma taką samą średnią, niezależnie od tego, czy ma 10 czy 30 tysięcy. Sytuacja wygląda bardzo podobnie dla pozostałych kategorii, gdzie różnice są naprawdę niewielkie. Nic dziwnego, że ten sposób liczenia numer dwa to festiwal popularności.

Rozkład ocen, nie tylko tych najlepszych, dla wszystkich kategorii pokazuje coś, czego się nie spodziewałem. Po pierwsze primo, jest bardzo małe prawdopodobieństwo, że trafimy na przepis z oceną poniżej 4,7. W skali od 1 do 5. Takich przepisów jest zaledwie 12, a zaszczytnym mianem crème de la crème, która postała zbyt długo w lodówce jest sałatka z melonem i fetą. Po drugie primo, mediana ocen dla wszystkich kategorii to 4,84, oprócz wypieków i deserów, gdzie to jest 4,83, z bardzo małym odchyleniem. Czy można ufać takiemu rozkładowi?

Powodów takiego zjawiska może być wiele. Na przykład, fakt, że na stronie znajdują się wyłącznie sprawdzone przepisy sprawia, że zmniejsza się pula tych, które mogłyby być uznane za „gorsze”. Być może skala od 1 do 5 jest za wąska i w pewnym momencie różnice zacierają się. A być może efekt dużej liczby głosów stabilizuje oceny właśnie w okolicy 4,83. Użytkownicy, jeśli przygotowali jakieś danie z przepisu, być może są skłonni dawać nieco wyższe oceny niż ich rzeczywiste odczucia. A jeśli coś im nie wyszło, wstrzymują się od oceny. Czy to znaczy, że Polacy unikają skrajnie niskich ocen? Nie powiem, byłaby to nowość.

„Pani Aniu, a czy można…?”

Skoro wydawane są książki kucharskie z przepisami, chciałbym kiedyś zobaczyć książkę z najlepszymi komentarzami do przepisów. Ta sekcja strony, nie tylko bohatera(-rki) dzisiejszej analizy, ale i wszystkich pozostałych, jest zawsze pełna. Od pochwał, rad, przez niezliczone pytania o możliwe zamienniki, aż po zdjęcia wykonanych dań.

Nie powinno nikogo dziwić, że w dziesiątce najczęściej komentowanych przepisów jest aż 9 ciast. Najpopularniejszy okazał się przepis na sernik, który zawsze się udaje. Chyba jest on na tyle dobry, że ma 50% więcej głosów niż drugi w rankingu przepis na szarlotkę, a ta ma ich ponad dwa tysiące. Im bardziej popularny przepis, tym ma więcej komentarzy – proste.

Do każdego komentarza można dodać zdjęcie, więc postanowiłem sprawdzić, które przepisy charakteryzują się najwyższą odtwarzalnością. Dla mnie to stosunek komentarzy ze zdjęciem do całkowitej liczby komentarzy. Nic dziwnego, tutaj znowu królują wypieki i desery. Prawie dwie trzecie osób, które zrobiło drożdżówki postanowiło się nimi pochwalić.

Korzystając z tych samych danych, możemy również wyodrębnić drugą kategorię. Dużo komentarzy, lecz mało zdjęć może świadczyć o dyskusji. Na pierwszym miejscu są ogórki kiszone, na trzecim bigos, a poza podium nalewka z pigwy. Muszę przyznać, że ogórki kiszone na pewno gorzej się fotografują od rogalików lub kokosanek, a po dwóch tygodniach kiszenia już niewielu osobom chce się dodawać zdjęcie. Czyli druga kategoria to dyskusja lub mniej fotogeniczna dania.

Czas na szybki obiad

Czy kiedykolwiek scrollowałeś/-aś przepisy na stronie, tak samo jak filmy na platformie streamingowej? Jeśli tak, witaj w klubie niezdecydowanych. Dołóżmy do tego jeszcze uczucie głodu i zmęczenia, które sprawia, że jednocześnie wszystko wygląda apetycznie, ale jednocześnie nie masz siły, żeby coś przygotować. To może chociaż coś szybkiego? Widzisz magiczne słowo „szybki przepis” to co myślisz? Czy rzeczywiście uda się zjeść coś szybciej, niż gdybyś wybrał/-a coś bez tego słowa?

Wybrałem przepisy na dania główne i dania z mąki z całkowitym czasem przygotowania do trzech godzin. W grupie szybkiej znalazły się przepisy, które w swojej zajawce miały właśnie to słowo. Po to Bozia dała oczy, żeby robić na oko, więc na oko widać, że mediana, czyli 50 percentyl różni się o 15 minut. Jednak żeby nadać temu odrobinę statystycznego rygoru, porównałem średnie testem t-studenta.

Jeśli widzicie przepis, który twierdzi, że jest szybki, zaufajcie mu. Statystycznie macie szansę oszczędzić kilka minut.

Kiedy będzie nowy przepis?

Ponad dwa tysiące przepisów w 10 lat to daje średnio jeden przepis co drugi dzień. Przez 10 lat. Im-po-nu-ją-ce. Największy rozwój blog zaliczył w latach 2017 oraz 2018, kiedy każdego roku przybyło ponad 250 nowych przepisów. W następnych latach ta liczba systematycznie spadała aż do ok. 150 przepisów rocznie w latach 2022 i 2023. Od 2024 aż do dzisiaj widać, na szczęście, tendencję wzrostową. Co więcej, jeśli tempo publikacji utrzyma się do końca roku, będzie to trzeci najlepszy rok względem liczby przepisów. Trend ten może potwierdzać lipiec 2025, kiedy pojawiło się aż 27 przepisów, podczas gdy miesiąc miał 31 dni. Również od 21 lipca do 6 sierpnia 2025 trwała najdłuższa w historii strony, siedemnastodniowa, passa, gdy codziennie był publikowany przepis.

Wszystkie kategorie przepisów były do tej pory rozwijane w równym tempie, bez poświęcania jednemu rodzajowi więcej czasu niż pozostałym.

Dopiero wizualizacja danych na poziomie dni pozwala odkryć kolejne wzorce. Do 2019 roku, przepisy były publikowane bez widocznego schematu. Od tamtego czasu publikacje następują w mniej lub bardziej regularnych odstępach. W 2019 roku to było zwykle cztery razy, a od 2021 trzy razy w tygodniu. Inny niż reszta był rok 2020, ale o tym nikomu nie muszę przypominać. Wtedy czytelnicy mogli spodziewać się nowego przepisu praktycznie co drugi dzień.

Spróbuj również…

Dzisiejsze strony internetowe nie mogą istnieć bez funkcji rekomendacji podobnych produktów lub artykułów, a w tym przypadków przepisów. Jedne są proste i mogą wybierać przepisy z tej samej kategorii lub podkategorii. Inne, bardziej zaawansowane, mogą używać algorytmy uczenia maszynowego lub sieci neuronowe, aby przewidzieć, co ma największą szansę kliknięcia, i w rezultacie pozostania dłużej na stronie.

Jak możemy określić podobieństwo przepisów? Przepisy składają się ze składników i instrukcji, jak je przyrządzić. Różne składniki można przygotować na wiele sposobów. Ziemniaki można gotować, piec, smażyć lub dusić. Jednak to jaki sposób wybierzemy można często w dużej mierze wywnioskować z kontekstu, czyli z pozostałych składników.

Chcę stworzyć prosty system rekomendujący podobne przepisy, do tego, który wybrałem. Jego podstawą będzie porównanie przepisów na podstawie występujących w nich składników. Ja potrafię określić, jak podobny jest jeden przepis do drugiego, jednak jak ma komputer to zrobić?

Zacznijmy przykładem. Ulubiony napój Taconafide zawiera mleko oraz miód, natomiast załóżmy, że mój to tylko mleko. Jak podobne więc są nasze napoje?

Pomoże nam przedstawienie przepisów w formie tabelarycznej, gdzie każdy składnik ma swoją kolumnę i jeśli pojawia się przepisie, dostaje wartość 1, lub 0 w razie braku.

przepismlekomiód
111
210

Teraz możemy przenieść te dane na układ współrzędnych i obliczyć cosinus kąta między punktami. Ta metryka to miara cosinusowa (ang. cosine similarity) i pozwala na określenie podobieństwa wektorów. Im wartość jest bliższa 1, tym wektory są do siebie bardziej podobne.

Wzór, który pozwala to obliczyć dla dowolnej liczby wymiarów przedstawia się następująco:

$$\text{Podobieństwo}(A, B) \;=\;\frac{\sum_{i=1}^n A_i B_i}{\sqrt{\sum_{i=1}^n A_i^2} \;\; \sqrt{\sum_{i=1}^n B_i^2}}$$

W liczniku jest iloczyn skalarny, czyli zwykłe mnożenie współrzędnych po kolei i sumowanie wyniku. W mianowniku za to jest liczenie długości wektorów $A$ i $B$. Ułamek z tych dwóch wartości to nic innego, jak właśnie cosinus kąta między wektorami $A$ i $B$.

Teraz wystarczy obliczyć podobieństwo dla każdego przepisu z każdym przepisem i wybrać dla każdego 5 z najwyższą wartością.

Jeśli chcecie sprawdzić wynik to przygotowałem aplikację i dostępna jest 👉tutaj 👈.

Zapraszam do zabawy!

Dane oraz kod

Dane pochodzą z dnia 08.09.2025.

Kod do analizy, wykresów oraz aplikacji znajduję się na repozytorium GitHub.

Zastrzeżenie

Wszystkie przepisy, zdjęcia oraz treści pochodzą ze strony aniagotuje.pl i stanowią jej wyłączną własność. Dane zostały wykorzystane wyłącznie w celach analitycznych i edukacyjnych. Nie roszczę sobie żadnych praw do treści ani materiałów należących do serwisu aniagotuje.pl.