Ewy

Google Trends: SIAN

Organisasjonen "Stopp Islamiseringen av Norge" (SIAN) har dessverre fått mye oppmerksomhet i det siste, og unødvendig mye rom i media. Kan vi se om dette gjenspeiler hva folk googler på? Både ja og nei.

Med Google Trends kan vi gå inn og sjekke søketrender med ganske god oppløsning. Du kan altså hente ut alt fra nettsiden eller bare bruke den til å leke deg med trender, men her bruker jeg R for å få det litt mer automatisert. Koden ligger nederst i innlegget.

Noen aktuelle nøkkelord i denne sammenheng er for eksempel SIAN, politivold, islam og ytringsfrihet. Som vist i plottet under, er det en tydelig økning i søkefrekvens på SIAN, men ikke noen av de andre

Vi kan også hente ut data på fylkesnivå. Hvordan ser ting ut da?

Det er relativt uklart. Men i enkelte fylker ser det ut til å være en korrelasjon. Hvordan sjekker vi det? Vi kjører autokorrelasjon mellom signalene. La oss bruke SIAN som referanse og kun hente ut høyeste korrelasjon (i praksis beregner vi korrelasjonen mellom signalene med ulik lag, d.v.s. mellom x(t+k) og y(t) for ulike k, og får da en score for hver lag-verdi), da får vi

På x-aksen har vi lag (i dager) og på y-aksen korrelasjon. Vi ser at Nordland, Troms og Rogaland har sin topp på null lag, så her søker man tydeligvis på Islam og SIAN samme dag. En positiv lag betyr at nøkkelordet kommer etter SIAN, og motsatt for negativ lag. Vi bør merke oss at vi ser på hele signalet, ikke bare toppene, slik at alle småtoppene vi ser i noen fylker også vil virke inn på resultatet, det kan forklare noen av de negative lags-ene. Men toppen for ytringsfrihet i Hordaland tyder på at dette henger sammen med SIAN, og det stemmer nok godt ettersom Bergen ligger i Hordaland og demonstrasjonen der fikk stor oppmerksomhet på grunn av måten politiet behandlet demonstranter (og motsatt) og hvordan dette henger sammen med ytringsfrihet. Det er imidlertid interessant at det ikke gjorde utslag i søk på politivold. I Finnmark er toppen for Islam forskjøvet med én uke, som også er avstanden mellom toppene i SIAN-søk, som tyder på at det er en sammenheng, men signalet forklares bedre om vi forskyver toppen en uke.

På nett kan vi også hente ut relaterte søk. Vi ser at disse er

  • hva er sian
  • sian bergen
  • sian oslo
  • sian demonstrasjon oslo
  • sian leder
  • siam
  • sian organisasjon
  • sian furuset

Oppsummert

Så, for å oppsummere ser vi at media-oppmerksomheten gjør at flere undersøker hva SIAN er, og i enkelte fylker ser vi et sammenfall med søk på Islam. I enkelte fylker ble flere interesserte i ytringsfrihet, men det ser ikke ut til at så mange begynte å søke på politivold.

Vi kan også sjekke om søkeord knyttet til høyreekstreme personer eller grupper samvarierer med SIAN. Det ville i så fall vært bekymringsfullt. Jeg klarte ikke å se noen tydelige mønster, og kjenner heller ikke til så mange søkeord, og vil helst ikke liste opp noen her heller. Men om du er nysgjerrig, kan vi mailes.

Bonus

Vi ser ganske tydelig i Oslo at det søkes ganske hyppig etter Islam. Kan vi beskrive dette mønsteret? En mulighet er fourier-analyse. Da kan vi få ut et spekter som ser slik ut

Frekvensen her er 1/dager. Det var ingen som stakk seg ut så mye som jeg hadde håpet, men null-frekvensen er da baseline og ikke så interessant i denne sammenheng. Det ser ut som vi har et mønster hvor folk søker på Islam omtrent annenhver dag (frekvensene mellom 0.3 og 0.5), men at det også er en 10-dagerstrend. Dette kan selvsagt være knyttet ti at vi bare ser på tre måneder med data, og at det kan ha vært en høytid eller noe slikt som fører til økt søkefrekvens.

R-kode

library("gtrendsR")
library("tidyverse")
data(countries)

search_terms <- c("SIAN", "Islam", "Ytringsfrihet", "Politivold")

gtrends(keyword = search_terms,
        geo = "NO",
        time = "today 3-m") -> output_results

output_results %>%
  .$interest_over_time %>%
  ggplot(aes(x = date, y = hits)) +
  geom_line() +
  facet_wrap(~keyword) +
  theme_bw() -> plot
ggsave("gtrend_SIAN.png", plot = plot, width = 10, height = 7)

fylker <- c("AKERSHUS","AUST-AGDER","BUSKERUD","FINNMARK","HEDMARK","HORDALAND","MORE OG ROMSDAL","NORDLAND","NORD-TRONDELAG","OPPLAND","OSLO","ROGALAND","SOGN OG FJORDANE","SOR-TRONDELAG","TELEMARK","TROMS","VEST-AGDER","VESTFOLD","OSTFOLD")
fylkeskoder <- countries[countries$name %in% fylker,]

output_results <- list()
df <- data.frame()
for(i in 1:nrow(fylkeskoder)){
  print(i)
gtrends(keyword = search_terms,
        geo = fylkeskoder$sub_code[i],
        time = "today 3-m") -> output_results[i]
  dftemp <- data.frame(date = output_results[[i]]$date, hits = output_results[[i]]$hits, keyword = output_results[[i]]$keyword, fylke = fylkeskoder$name[i])
  df <- rbind(df, dftemp)
}

df %>%
  ggplot(aes(x = date, y = hits, color = keyword)) +
  geom_line() +
  facet_wrap(~fylke, ncol = 4) +
  theme_bw() + theme(legend.position = "bottom") -> plot
ggsave("gtrend_SIAN_fylke.png", plot = plot, width = 12, height = 7)

cc <- 1
ltemp <- list()
dfccf <- data.frame()
for(i in unique(df$fylke)){
  for(j in unique(df$keyword[df$keyword != "SIAN"])){
    ltemp[[cc]] <- ccf(subset(df, fylke == i & keyword == "SIAN")$hits, subset(df, fylke == i & keyword == j)$hits, plot = FALSE)
    dfccf[cc, 1] <- i
    dfccf[cc, 2] <- j
    dfccf[cc, 3] <- max(ltemp[[cc]]$acf)
    dfccf[cc, 4] <- ifelse(!is.na(dfccf[cc, 3]), ltemp[[cc]]$lag[ltemp[[cc]]$acf == dfccf[cc, 3]], NA)
    cc <- cc + 1
  }
}

colnames(dfccf) <- c("fylke", "keyword", "acf", "lag")

ggplot(dfccf, aes(x = lag, y = acf, color = keyword)) + facet_wrap(~fylke) + geom_vline(xintercept = 0) + geom_point() + theme_bw() + theme(legend.position = "bottom")
ggsave("gtrend_SIAN_ccf.png", width = 12, height = 7)

Bonuskode

x.spec <- spectrum(subset(df, keyword == "Islam" & fylke == "OSLO")$hits,log="no",span=10,plot=FALSE)
spx <- x.spec$freq
spy <- 2*x.spec$spec
png("gtrends_SIAN_freq.png")
plot(spy~spx,xlab="frequency",ylab="spectral density",type="l")
dev.off()

Contents