Raportti tekoälyn hyödyntämisestä vihapuheen seurannassa julkaistu

oikeusministeriö
Julkaisuajankohta 22.4.2021 10.03
Tiedote

Tänään julkaistu Tekoälyn hyödyntäminen vihapuheen seurannassa -raportti tarjoaa kokonaiskuvan verkon julkisessa keskustelussa esiintyvästä suomenkielisestä vihapuheesta. Raportin teki Utopia Analytics, joka yhdisti työssä ihmistyötä ja koneoppimista. Oikeusministeriö tilasi raportin osana EU-rahoitteista Tiedolla vihaa vastaan -hanketta.

Aineistossa ei ole mukana ei-julkinen keskustelu, kuten Facebookin suljetut ryhmät ja yksityiset tilit.

Raportissa vihapuheella tarkoitetaan viestintää, jonka merkitys tai sävy on halventava, nöyryyttävä, uhkaava, vihamielinen, hyökkäävä tai epäinhimillistävä. Kohteena voivat olla henkilökohtaiset ominaisuudet kuten henkilön ikä, uskonto tai vakaumus tai tietty ihmisryhmä.

Raportin tarkoituksena ei ole ottaa kantaa siihen, onko jokin yksittäinen ilmaisu laissa kielletty.
 
Vihapuhe julkisilla keskustelupalstoilla

Raportin mukaan 97 prosenttia vihapuheesta esiintyy verkon keskustelupalstoilla, näistä valtaosa Ylilauta-sivustolla. 2,5 prosenttia vihapuheeksi tunnistetuista viesteistä esiintyi Twitterissä.

Julkisilla suomenkielisillä alustoilla on noin 150 000 vihapuheeksi luokiteltavaa viestiä kuukaudessa. Tämä on 1,8 prosenttia kaikista viesteistä.

Ihmisryhmiä leimaava ja yleistävä vihapuhe yleisintä

Suurimmilta keskustelupalstoilta ja uutissivustoilta, blogeista sekä julkisista keskusteluista Twitterissä, Facebookissa ja Instagramissa kerätty aineisto analysoitiin tarkemmin tekoälyn avulla.

Tästä aineistosta 62 prosenttia luokiteltiin ihmisryhmää leimaavaksi tai yleistäväksi, 32 prosenttia solvaukseksi tai muuksi vihapuheeksi, 4 prosenttia henkilökohtaisiin ominaisuuksiin liittyväksi vihapuheeksi ja 2 prosenttia ammattiryhmään kohdistuvaksi vihapuheeksi.
 
Kattava kuva internetin julkisesta suomenkielisestä vihapuheesta

Aineisto koostuu julkisen internetin noin 12 miljoonasta suomenkielistä kommentista ja nettikirjoituksesta syys–lokakuussa 2020. Aineisto käsittää muun muassa suurimmat keskustelupalstat ja uutissivustot, blogeja sekä julkisia keskusteluja Twitterissä, Facebookissa ja Instagramissa.

Raporttia varten kerättiin aineistoa myös käsin Ylilauta- ja Hommaforum-sivustoilta, joille hakurobottien vierailut on estetty.

Utopia Analyticsin raportti julkaistaan oikeusministeriön julkaisusarjassa. Raportin sisällöt ovat täysin tekijöiden vastuulla, eivätkä ne välttämättä edusta Tiedolla vihaa vastaan -hanketta rahoittavan Euroopan komission tai oikeusministeriön näkemyksiä.

Lisätiedot:

Utopia Analytics
TKT, CEO, Mari-Sanna Paukkeri, Utopia Analytics, p. 050 344 0501, [email protected]
väitöskirjatutkija Laura Kettunen, FM, [email protected]

Oikeusministeriö
hankepäällikkö Milla Aaltonen, p. 0295 150 061, [email protected]  

Tekoälyn hyödyntäminen vihapuheen seurannassa -raportti