Siirry pääsisältöön

Bayesilaista laskentamenetelmää käyttävä kokeellinen tilastojulkistus vapaa-ajankalastuksesta

Uutinen 4.12.2024

Luonnonvarakeskus (Luke) on julkistanut kokeellisen tilaston vapaa-ajankalastuksesta. Julkistuksen merkitys perustuu tilaston laskentamenetelmään, sillä tämä on mahdollisesti ensimmäinen bayesilaista tilastotiedettä soveltava tilastojulkistus maailmassa. Kokeelliset tilastot ovat vielä kehittämisvaiheessa ja kuvaavat uusia ilmiöalueita, hyödyntävät uudenlaista dataa tai perustuvat uusiin laskentamenetelmiin.

Kokeellinen tilasto vapaa-ajankalastuksesta

Uusien, aineistoa tehokkaasti hyödyntävien laskentamenetelmien soveltaminen on keskeisen tärkeää, koska yhä useammat jättävät vastaamatta heille saapuneisiin kyselyihin. Tilasto vapaa-ajankalastuksesta perustuu joka toinen vuosi tehtävään kansalaiskyselyyn. Kyselyn vastausaste oli suurimmillaan 60–70 prosenttia vuosituhannen vaihteessa. Sen jälkeen vastausaste on pienenentynyt voimakkaasti ja oli jonkin verran yli 20 prosenttia edellisessä, vuonna 2023 toteutetussa tiedonkeruussa.

Kokeellisessa tilastossa arvioitiin vapaa-ajankalastusta harjoittaneiden suomalaisten asuntokuntien lukumäärä vuonna 2022. Niitä oli todennäköisimmin noin 973 000. Kalastonhoitomaksun lunastaneista asuntokunnista 94 prosenttia harjoitti kalastusta. Niistä asuntokunnista, joihin kalastonhoitomaksua ei lunastettu, kalasti noin 30 prosenttia.

”Vapaa-ajankalastuksen kokeellinen tilasto pohjautuu Luken Tilastopalvelut-yksikön tutkija Antti Sykön opinnäytetyöhön. Laskennassa käytettiin myös vanhempaa, vuosina 2014–2020 kerättyä kyselyaineistoa ennakkotietona. Tilastotuotannossa sovelletaan normaalisti frekventististä laskentaa, jossa aikaisempien aineistojen hyödyntäminen olisi ollut rajoitetumpaa. Tulokset kokeellisen ja virallisen tilaston välillä ovat yhdenmukaisia: kalastaneiden asuntokuntien lukumäärän odotusarvot poikkeavat toisistaan pari prosenttia.”, kertoo yliaktuaari Mika Rahikainen Lukesta.

Tavoitteena luotettava ja tehokkaasti tuotettu tieto

Tilastokyselyihin vastaamisen väheneminen on globaali trendi kaikissa kysely- tai haastattelumenetelmällä toteutetuissa tutkimuksissa. Tilastoarvioiden epävarmuus kasvaa vastausasteiden pienentyessä. Tilannetta pahentaa yleinen tiedonkeruukustannusten nousu yhdistettynä ajankohtaisiin julkisen talouden leikkauksiin Suomessa. Tietoon perustuvaa, luotettavaa päätöksentekoa varten tulisi kuitenkin tuottaa mahdollisimman tarkkoja pohjatietoja.

”Perinteisistä menetelmistä poiketen Bayesin lähestymistavassa arvioihin liittyvä epävarmuus voidaan viestiä selkeästi, mikä auttaa päätöksentekijöitä ymmärtämään tilastoarvioiden luonteen ja käyttämään niitä harkitusti. Tämä on tulevaisuudessa entistäkin tärkeämpää, koska kyselyiden vastausasteen lasku johtaa väistämättä siihen, että tilastoja joudutaan tuottamaan pienillä aineistoilla”, kertoo Sykkö.

Tilastotieteen termeistä

  • Tilastotuotannon traditio perustuu frekventistiseen teoriaan ja filosofiaan. Siinä tilastoarviot lasketaan kutakin tilastovuotta varten kerätystä aineistosta. 
  • Bayesilainen tilastotiede on tehokas työkalu, koska sillä voidaan yhdistää useiden vuosien tilastoaineistot samaan laskentakehikkoon ja siten lisätä arvioiden tarkkuutta. 
  • Lisäksi arvioihin sisältyvä kokonaisepävarmuus voidaan laskea. Tämä on mahdollista, koska bayesilaisessa paradigmassa sekä arvioitavaan suureeseen liittyvää epävarmuutta että aineiston satunnaisvaihtelua voidaan kuvata todennäköisyysjakaumien avulla. Tiedon esittäminen todennäköisyysjakauman avulla mahdollistaa eri lähteistä saatavilla olevien tietojen yhdistämisen todennäköisyyslaskennan sääntöjä noudattaen. 
  • Frekventistisessä tilastotieteessä voidaan vain aineiston satunnaisvaihtelua kuvata todennäköisyysjakaumalla, jolloin arvioitavien suureiden epävarmuuden suora mittaaminen ei ole mahdollista.