Analizator ogłoszeń OtoMoto

Analizator ogłoszeńProgram do analizowania danych o ogłoszeniach sprzedaży samochodów ze strony otomoto.pl.
W ostatnich latach pojawiło się wiele opinii, że samochody używane mają więcej przebiegu niż to wynika ze wskazania licznika przebiegu. Postanowiłem to w pewien sposób zweryfikować. W OtoMoto pojawiają się samochody z różnymi rocznikami, więc posiadając dane ogłoszeń różnych samochodów z różnymi rocznikami i przebiegami, można by zauważyć pewne odchylenia w zależności od czynnika, np. jak zmienia się przebieg w zależności od rocznika pojazdu.

Analizator pozwala agregować dane za pomocą predefiniowanych zapytań SQL (np. „Średni przebieg i cena w zależności od rocznika”) i tworzyć nowe zapytania. Wyniki zapytań prezentowane są w tabeli z możliwością sortowania kolumn. Automatycznie generuje się wykres zależności, aby zobrazować wyniki.

Analizator korzysta z danych zgromadzonych w bazie danych PostgreSQL. Dane uzupełniane są przy pomocy utworzonego przeze mnie specjalnego crawlera OtoMoto, napisanego w Pythonie, uruchamianego automatycznie raz dziennie nad ranem.


Jakie wnioski z analizy?

Biorąc pod uwagę wszystkie ogłoszenia, w samochodach starszych niż 3 lata widać wyraźne zahamowanie wzrostu przebiegu (obrazek na początku wpisu), która ta tendencja się potem utrzymuje aż do wieku około 13 lat, kiedy rośnie szybciej. Choć i tak trudno uwierzyć w przebieg ok. 250 000 km dla 14-letniego auta.

Ciekawiej wygląda sytuacja, gdy zawęzimy sobie ogłoszenia tylko do Volkswagenów Passatów:

Przebieg w zależności od rocznika dla PassatówPassaty 5 do 13 roku od produkcji przejeżdżają około 40 000 km, gdzie od 1 do 4 roku przejechały ok. 170 000 km. Daje to do myślenia:)

Tutaj cena Passatów w zależności od wieku.Cena Passatów w zależności od wieku
Program ma naprawdę spory potencjał, można się dowiedzieć sporo o polskim rynku samochodów używanych, i w zasadzie pozbyć się złudzeń co do kupna „pewnego” samochodu.

Dane dotyczą ogłoszeń od marca do maja 2014 r.

Kontrolka do generowania wykresów to ZedGraph.