Tilastotieteen ja todennäköisyyslaskennan englantilais–suomalainen sanasto


Tietoja ja linkkejä


Oheisen sanaston rinnalla suosittelen käyttämään ISI:n (International Statistical Institute) sivustoa ISI glossary of statistical terms, johon on v. 2004 lisätty myös suomenkieliset termit.

A

absolute scale = absoluuttinen asteikko
absolutely continuous = absoluuttisesti jatkuva
additive = additiivinen
 • generalized additive model = yleistetty additiivinen malli
adjusted = korjattu, vakioitu
admissible = kelvollinen, käypä
 • admissible estimator
AIC, Akaike's information criterion = Akaiken informaatiokriteeri
almost certainly = melkein varmasti
almost everywhere = melkein kaikkialla
almost surely = melkein varmasti
alternative (hypothesis) = vaihtoehtoinen (hypoteesi), vaihtoehtohypoteesi
analysis = analyysi
 • analysis of variance (ANOVA) = varianssianalyysi
 • ANOVA table = varianssitaulu
 • oneway analysis of variance = yksisuuntainen varianssianalyysi
 • analysis of covariance (ANCOVA) = kovarianssianalyysi
ancillary statistic = sivutunnusluku
arithmetic mean = (aritmeettinen) keskiarvo
asymptotic = asymptoottinen
 • asymptotic distribution = asymptoottinen jakauma
 • asymptotic expansion = asymptoottinen kehitelmä
 • asymptotic normality = asymptoottinen normaalisuus
autocorrelation = autokorrelaatio
autoregressive = autoregressiivinen
average = keskiarvo

B

bar chart = pylväskuvio, -diagrammi
bar graph = pylväskuvio
bar plot = pylväskuvio
Bayes formula = Bayesin kaava
Bayesian = bayesläinen, bayeslainen, bayesiläinen, bayesilainen, Bayes-
esimerkkejä: Bayesian inference; Bayesian statistics. Huom: erisnimistä tehdyt johdokset kirjoitetaan suomen kielessä pienellä alkukirjaimella.
bias = harha
 • biased = harhainen
 • unbiased = harhaton
bimodal = kaksihuippuinen
binomial coefficient = binomikerroin
bioassay = biotesti
biometrics = biometria
biometry = biometria
birth and death process = syntymis- ja kuolemisprosessi
bivariate = kaksiulotteinen, kaksimuuttujainen
 • bivariate normal distribution = kaksiulotteinen normaalijakauma
block = lohko
Bonferroni adjustment/correction/inequality = Bonferronin korjaus; epäyhtälö
bootstrap = saapasremmi, -hihna, bootstrap-menetelmä
Termi bootstrap perustuu sanontaan pull oneself up by one's bootstraps, 'tulla toimeen omin avuin', joka taas pohjautuu paroni von Münchhausenin seikkailuihin.
bounded in probability = stokastisesti rajoitettu
ominaisuus, joka voi olla satunnaismuuttujajonolla. Synonyymeja: stochastically bounded, tight.
branching process = haarautumisprosessi
Brownian motion = Brownin liike

C

calibration = kalibrointi
canonical correlation = kanoninen korrelaatio
canonical correlation coefficient = kanoninen korrelaatiokerroin
capture–recapture method = merkintä–takaisinpyynti-menetelmä, toistopyydystysotanta
case-control study = tapaus-verrokki -asetelma t. -tutkimus
categorical variable = kategorinen muuttuja, luokitteleva m.
Kategorista muuttujaa mitataan luokka-asteikolla. Synonyymi: qualitative v. = kvalitatiivinen m.
censoring = sensurointi, rajaaminen
central limit theorem (CLT) = keskeinen raja-arvolause
change point = muutospiste
characteristic (n.) = ominaisuus
characteristic function = karakteristinen funktio
Tilastotieteessä ja todennäköisyyslaskennassa karakteristinen funktio tarkoittaa samaa kuin Fourier-muunnos. Matemaattisen analyysin harrastajan karakteristinen funktio = todennäköisyyslaskijan indikaattorifunktio.
chi = khii
chi square(d) = khiin neliö
class interval = luokkaväli
Histogrammissa.
classification = luokittelu
Huom: suuressa osassa kirjallisuutta termit classification, discrimination ja statistical pattern recognition ovat (lähes) synonyymeja. Tästä poiketen osa kirjoittajista käyttää termiä classification tarkoittamaan sitä asiaa, johon tavallisesti viitataan termillä clustering tai cluster analysis.
cluster = ryhmä, ryväs, klusteri
cluster analysis = ryhmittelyanalyysi
clustering = (a) ryhmittelyanalyysi; (b) ryhmittely (ryhmittelyanalyysin tulos)
coefficient of determination = selitysaste
Käytetään lineaarisessa regressiossa; R^2 (R-squared)
computational statistics = laskennallinen tilastotiede
concordant = yhtäpitävä
conditional = ehdollinen
 • conditional expectation = ehdollinen odotusarvo
 • conditional distribution = ehdollinen jakauma
 • conditional probability = ehdollinen todennäköisyys
 • full conditional (distribution) = täysehdollinen jakauma, täysin ehdollistettu jakauma
conditioning = ehdollistaminen
confidence = luottamus-
 • confidence interval (CI) = luottamusväli
 • confidence set = luottamusjoukko
 • confidence level = luottamustaso
confounder = sekoittava tekijä, sekoittaja
consistent = tarkentuva
 • weakly/strongly consistent estimator = heikosti/vahvasti tarkentuva estimaattori
contingency table = kontingenssitaulu
continuity correction = jatkuvuuskorjaus
contrast = kontrasti
control (n.) = säätö, kontrolli
control group = vertailuryhmä, kontrolliryhmä
control = kontrolli (koeyksikkö, johon ei kohdisteta tahallista käsittelyä), verrokki
controlled experiment = kontrolloitu koe
converge = supeta, konvergoida
jono satunnaismuuttujia voi supeta mm. seuraavilla tavoilla kohti rajasatunnaismuuttujaa
 • converges almost certainly = suppenee melkein varmasti
 • converges almost surely = suppenee melkein varmasti
 • converges in distribution = suppenee jakaumaltaan
 • converges quadratically = suppenee kvadraattisesti
 • converges in probability = suppenee stokastisesti
convergence = suppeneminen, konvergenssi, konvergointi
 • almost certain convergence = melkein varma suppeneminen
 • almost sure convergence = melkein varma suppeneminen
 • convergence in distribution = jakaumasuppeneminen
 • convergence in probability = stokastinen suppeneminen
 • quadratic convergence = kvadraattinen suppeneminen
correlation = korrelaatio
 • correlation coefficient = korrelaatiokerroin
 • correlation matrix = korrelaatiomatriisi
correspondence analysis = korrespondenssianalyysi
counting process = laskuriprosessi
covariance = kovarianssi
covariance matrix = kovarianssimatriisi
covariate = kovariaatti
Cramér–Rao lower bound = Cramérin–Raon alaraja
credible interval = bayesläinen luottamusväli, Bayes-luottamusväli
critical = kriittinen
Esiintyy testien yhteydessä:
 • critical region = kriittinen alue, hylkäysalue
 • critical value = kriittinen arvo
cross-sectional = poikittais-
cross-tabulation = ristiintaulukointi
cross-validation = ristiinvalidointi
Muita ehdotuksia: ristiin varmistus/vahvistus/tarkistus/testaus
 • leave-one-out cross-validation = yksi-pois -ristiinvalidointi
 • v-fold cross-validation = v-kertainen ristiinvalidointi
cumulant = kumulantti
cumulant generating function = kumulanttiemäfunktio
cumulative distribution function (cdf, CDF) = kertymäfunktio
Synonyymi distribution function on hyvin yleinen
cumulative frequency = summafrekvenssi
cumulative frequency polygon == ogive = summakäyrä
curse of dimensionality = dimensiokirous, dimensioiden kirous
cut point = katkaisupiste, kynnysarvo
cyclic change = toistuva vaihtelu, kausivaihtelu

D

data = data, (havainto)aineisto
Huom: data on englannin kielessä monikkomuoto; yksikkö on datum.
data analysis = data-analyysi
J. Tukeyn käyttöön ottamalle erottelulle confirmatory data analysis / exploratory data analysis (EDA) ei näytä olevan vakiintunutta käännöstä. Laiskan ihmisen käännös: konfirmatorinen/eksploratiivinen data-analyysi.
data augmentation = aineiston täydennys(menetelmä)/täydentämis(menetelmä)
data generating process = aineiston tuottanut prosessi, aineistoa tuottava prosessi
data matrix = havaintomatriisi
data mining = tiedon louhinta
decision theory = päätösteoria, päätäntäteoria
decision tree = päätöspuu
degrees of freedom (df) = vapausaste(-luku)
Esimerkkejä:
 • chi-squared distribution with q degrees of freedom = \chi^2-jakauma vapausasteilla q, \chi^2-jakauma q vapausasteella
 • F-distribution with m and k degrees of freedom = F-jakauma vapausastein m, k
 • approximate degrees of freedom = approksimoidut vapausasteet
delta method = delta-menetelmä
Taylorin kehitelmään perustuva menetelmä estimaattorin asymptoottisen jakauman löytämiseksi
density estimation = tiheysfunktion estimointi
density function = tiheysfunktio
dependency = riippuvuus
dependent variable = riippuva muuttuja, selitettävä muuttuja, vaste (regressiossa)
Dependent variable == response
descriptive statistics = kuvaileva tilastotiede
design = (koe)asetelma
design of experiments = koesuunnittelu, kokeiden suunnittelu
deterministic = deterministinen
deviance = devianssi
diagnostics = diagnostiikka
diagram = kuvio, diagrammi, diagramma
dichotomous variable = dikotominen muuttuja, binäärimuuttuja
diffusion process = diffuusioprosessi
dimension reduction = ulotteisuuden pienentäminen, dimension pienentäminen
dimensionality = ulotteisuus
directed acyclic graph, DAG = suunnattu asyklinen verkko
discrete = diskreetti
discrete distribution = diskreetti jakauma
discriminant analysis = erotteluanalyysi
discrimination = erottelu
distribution = jakauma
 • Bernoulli d. = Bernoullin j., Bernoulli-j.
 • beta d. = beetaj., betaj.
 • binomial d. = binomij.
 • chi-squared d. = khiin neliön j.
 • Dirichlet d. = Dirichletin j.
 • exponential d. = eksponenttij.
 • negative exponential d. == exponential d. (synonyymejä!)
 • double exponential d. = kaksitahoinen eksponenttij., kaksoiseksponenttij., Laplacen jakauma
 • gamma d. = gammaj.
 • inverse gamma d. == inverted gamma d. = käänteinen gammaj. (gammamuuttujan käänteisarvon jakauma)
 • (Fisher's) F-d. = (Fisherin) F-jakauma
 • geometric d. = geometrinen j.
 • hypergeometric d. = hypergeometrinen j.
 • multinomial d. = multinomij.
 • normal d. = normaalij.
 • multivariate normal d. == multinormal d. = moniulotteinen normaalij., multinormaalij.
 • logistic d. = logistinen j.
 • lognormal d. = lognormaalinen j.
 • negative binomial d. = negatiivinen binomij.
 • Pareto d. = Pareton j.
 • Poisson d. = Poissonin j., Poisson-j.
 • standard normal d. = normitettu normaalij., standardinormaalij.
 • (Student's) t-d. = (Studentin) t-j., Studentin j.
 • trinomial d. = trinomij.
 • uniform d. = tasaj., tasainen j.
 • Wishart d. = Wishartin j.
distribution free = jakaumasta riippumaton
distribution function = kertymäfunktio
synonyymi: cumulative distribution function, cdf, CDF
double blind = kaksoissokko-
double blind experiment = kaksoissokkokoe
draftsmans's display, draftsman's plot = ks. scatter plot matrix
draughtsman's display, draughtsman's plot = ks. scatter plot matrix
dummy variable = indikaattorimuuttuja, osoitinmuuttuja, dummy-muuttuja

E

efficient = tehokas
efficiency = tehokkuus; fully efficient = täystehokas
EM algorithm (expectation–maximization algorithm) = EM-algoritmi
empirical = empiirinen, kokemusperäinen
 • empirical distribution = empiirinen jakauma
 • empirical (cumulative) distribution function = empiirinen kertymäfunktio
 • empirical measure = empiirinen mitta
 • empirical probability = empiirinen todennäköisyys
entropy = entropia
maximum entropy method = suurimman entropian menetelmä
ergodic = ergodinen
error of the first kind = hylkäysvirhe, ensimmäisen lajin virhe
error of the second kind = hyväksymisvirhe, toisen lajin virhe
estimate (n.) = estimaatti, arvio
 • interval estimate = väliestimaatti
 • least squares estimate (LSE) = pienimmän neliösumman estimaatti
 • maximum a posteriori estimate, MAP estimate = MAP-estimaatti, posteriorijakauman moodi
 • maximum likelihood estimate (MLE) = suurimman uskottavuuden estimaatti
 • point estimate = piste-estimaatti
estimate (v.) = estimoida, arvioida
estimation = estimointi
 • point estimation = piste-estimointi;
 • interval estimation = väliestimointi
estimator = estimaattori, arvio (satunnaismuuttujana)
ks. kohdan estimate (n.) esimerkkejä.
exchangeable = vaihdannainen, vaihdettava
Synonyymi: interchangable. Vaihdannaisuus on (äärellisen tai äärettömän) satunnaismuuttujajonon jakauman ominaisuus.
expectation = odotusarvo
expected value = odotusarvo
experiment = koe
 • experimental design = koesuunnitelma; kokeen suunnittelu
 • experimental unit = koeyksikkö
explanatory variable = selittävä muuttuja, selittäjä, riippumaton muuttuja (regressiossa)
explanatory variable == independent variable, regressor
exploratory = kartoittava, etsivä, ekspolratiivinen
exponential = eksponentti(-)
 • exponential function = eksponenttifunktio
 • exponential family = eksponenttiperhe
 • scaled exponential family = skaalattu eksponenttiperhe
extrapolation = ekstrapolaatio

F

factor = faktori, tekijä
 • factor analysis = faktorianalyysi
 • common factor = yhteisfaktori
 • special factor = ominaisfaktori
factorial experiment = faktorikoe, yhdistelykoe
failure = vika-, vikaantuminen, viottuminen
 • failure time = vikaantumisaika
 • failure rate == hazard rate = vikataajuus, vikatiheys, vioittuvuus
filter = suodin, suodatin
linear filter = lineaarinen suodin
filtration = historia
historia on kasvava perhe sigma-algebroja.
fit (n.) = (a) sovite; (b) yhteensopivuus
fit (v.) = sovittaa
fitted value = sovite
fixed effects model = kiinteiden vaikutusten malli
forecast = ennustaa, ennuste
fractile = fraktiili, kvantiili
frequency = (1) lukumäärä, frekvenssi; (2) taajuus
 • frequency polygon = frekvenssimonikulmio, frekvenssikäyrä
 • relative frequency = suhteellinen frekvenssi
Huom: jossain asiayhteyksissä (esim. allele frequency) tällä sanalla tarkoitetaan suhteellista frekvenssiä eli suhteellista osuutta.

G

game theory = peliteoria
generalized additive model, GAM = yleistetty additiivinen malli
generalized linear model, GLM = yleistetty lineaarinen malli
generating function = generoiva funktio, emäfunktio
genetic algorithm = geneettinen algoritmi
geometric mean = geometrinen keskiarvo, keskiverto
goodness of fit = yhteensopivuus
graph = (a) kuvio, piirros; (b) verkko, graafi
graphical display = graafinen esitys, graafinen esittäminen
graphical model = graafinen malli
sana graphical viittaa tässä termissä graafeihin.

H

harmonic mean = harmoninen keskiarvo
hazard function, hazard rate = hasardifunktio, riskifunktio, vaarafunktio
heads = kruuna
Hessian (matrix) = Hessen matriisi
heteroscedastic = heteroskedastinen, erivarianssinen
hidden Markov model, HMM = kätketty Markovin malli, piilotettu Markovin malli (ei vakiintunut)
histogram = histogrammi, histogramma
 • frequency histogram = frekvenssihistogrammi
 • density histogram = tiheyshistogrammi
homoscedastic = homoskedastinen, vakiovarianssinen
hypothesis = hypoteesi
 • hypothesis testing = hypoteesin testaus
 • null hypothesis = nollahypoteesi
 • alternative hypothesis = vaihtoehtoinen hypoteesi
 • simple hypothesis = täysin määrätty hypoteesi
 • composite hypothesis = osittain määrätty hypoteesi

I

i.i.d. = riippumaton ja samoin jakautunut
Tällainen ominaisuus voi olla jonolla satunnaismuuttujia (tai muita satunnaisalkioita: satunnaisvektoreita, satunnaismatriiseja, ...). Lyhenne i.i.d. tulee sanoista independent, identically distributed.
identifiable = identifioituva
image analysis = kuva-analyysi
image processing = kuvankäsittely
imputation = paikkaaminen, paikkaus, puuttuvien tietojen korvaaminen
independent = riipumaton
indicator variable = indikaattorimuuttuja , osoitinmuuttuja, ilmaisinmuuttuja
indicator variable == dummy variable
indistinguishable = erottamaton
kaksi stokastista prosessia voivat olla erottamattomia.
inference = päättely
inferential statistics = tilastollinen päättely, tilastollinen inferenssi
influence function = influenssifunktio
information = informaatio
 • observed information = havaittu informaatio
 • expected information = odotettu informaatio eli Fisherin informaatio
 • Fisher's information (matrix) = Fisherin informaatio(matriisi)
information theory = informaatioteoria
interaction = yhteisvaikutus, yhdysvaikutus
intercept = (regressioyhtälön) vakiotermi, (suoran ja y-akselin välinen) leikkauspiste
intergrable = integroituva
interquartile range = kvartiilivälin pituus
interval estimation = väliestimointi
interval scale = intervalliasteikko, väliasteikko, välimatka-asteikko
iteratively reweighted least squares = iteratiivinen painotettu pienimmän neliösumman menetelmä

J

jackknife = linkkuveitsi(menetelmä), jacknife-menetelmä
Termi viittaa kyseisen menetelmän yleiskäyttöisyyteen ja siihen, että menetelmä ei missään käyttötarkoituksessaan välttämättä ole paras mahdollinen.
Jacobian (matrix) = Jacobin matriisi, funktionaalimatriisi
joint distribution = yhteisjakauma

K

kernel estimate = ydinestimaatti
menetelmä(perhe) parametrittomaan tiheysfunktion ja regressiofunktion estimointiin
 • kernel density estimate = tiheysfunktion ydinestimaatti
 • kernel regression estimate = regressiofunktion ydinestimaatti, ydinregressioestimaatti (termillä viitataan esim. Nadarayan—Watsonin estimaattoriin)
kriging = kriging-menetelmä
Kronecker product = Kroneckerin (matriisi)tulo
kurtosis = huipukkuus
 • leptokurtic = huipukkaampi (terävämpi) kuin normaalijakauma
 • platykurtic = latteampi kuin normaalijakauma
 • mesokurtic = yhtä huipukas kuin normaalijakauma

L

lag = viive
large sample method/theory = suurten otosten mentelmä/teoria
latent variable = latentti muuttuja, piilomuuttuja
Latin square = latinalainen neliö
law of large numbers = suurten lukujen laki
 • strong law of large numbers (SLLN) = vahva suurten lukujen laki
 • weak law of large numbers (WLLN) = heikko suurten lukujen laki
law of the iterated logarithm (LIL) = iteroidun logaritmin laki
legend = selite
likelihood = uskottavuus
 • likelihood function = uskottavuusfunktio
 • likelihood ratio = uskottavuusosamäärä
 • likelihood ratio test = uskottavuusosamäärätesti
 • maximum likelihood estimate/estimator (MLE) = suurimman uskottavuuden estimaatti/estimaattori
 • log-likelihood function = logaritminen uskottavuusfunktio, logaritmoitu uskottavuusfunktio, log-uskottavuusfunktio, uskottavuusfunktion logaritmi
 • profile likelihood function = profiiliuskottavuusfunktio
 • profile log-likelihood function = profiili-log-uskottavuusfunktio
linear model = lineaarinen malli, lineaarimalli
linear regression = lineaarinen regressio, lineaariregressio
link (function) = linkkifunktio
canonical link function = kanoninen linkkifunktio
loading = lataus
local linear regression = lokaali lineaarinen regressio
local polynomial regression = lokaali polynomiregressio, lokaali polynominen regressio
logistic = logistinen
logistic regression = logistinen regressio
logit transformation = logit-muunnos
longitudinal = pitkittäis-
 • longitudinal data = pitkittäisaineisto
loss = tappio, hukka
 • loss function = tappiofunktio
 • quadratic loss(function) = kvadraattinen tappio(funktio)

M

machine learning = koneoppiminen
Mahalanobis distance = Mahalanobisin etäisyys, Mahalanobis-etäisyys
marginal distribution = reunajakauma
Markov chain = Markovin ketju
Markov chain Monte Carlo method (MCMC method) = Markovin ketju Monte Carlo -menetelmä, MCMC-menetelmä
Markovin ketjujen simulointiin perustuva Monte Carlo -menetelmä
Markov process = Markovin prosessi
martingale = martingaali
 • semimartingale = semimartingaali
 • submartingale = alimartingaali
 • supermartingale = ylimartingaali
 • reversed martingale = takaperoinen martingaali
mass function = pistetodennäköisyysfunktio
lyhenne termistä probability mass function (pmf)
maximum likelihood estimate (MLE) = suurimman uskottavuuden estimaatti, SU-estimaatti
maximum likelihood method (ML method) = suurimman uskottavuuden menetelmä
mean deviation = keskipoikkeama
mean square(d) error (MSE) = keskineliövirhe, keskimääräinen neliövirhe, keskineliöpoikkeama
 • root mean square(d) error (RMSE) = keskineliövirheen neliöjuuri
 • mean integrated square(d) error (MISE) = integroitu keskineliövirhe
measurable = mitallinen
measure = mitta
 • probability measure = todennäköisyysmitta
 • counting measure = laskurimitta, lukumäärämitta
 • signed measure = merkkinen mitta
 • complex measure = kompleksimitta
 • product measure = tulomitta
measure theory = mittateoria
measures of central tendency = keskiluvut
measures of dispersion and variability = hajontaluvut
measurment scale = mitta-asteikko
median = mediaani
meta-analysis = meta-analyysi
method = menetelmä
 • method of moments = momenttimenetelmä
 • method of least squares == least squares method = pienimmän neliösumman menetelmä
 • method of maximum likelihood == maximum likelihood method (ML method) = suurimman uskottavuuden menetelmä
missing data = puuttuvat tiedot
mixed model = sekamalli
mixing (adj.) = sekoittuva
satunnaismuuttujajonon (jakauman) ominaisuus
mixture = sekoite(-), sekoitus(-)
 • mixture distribution = sekajakauma, sekoitejakauma, sekoitusjakauma
 • mixture model = sekoitemalli
mode = moodi, tyyppiarvo
model = malli
 • model averaging = mallien keskiarvoistaminen
 • model selection = mallinvalinta
modeling = mallintaminen
moment = momentti
 • absolute moment = itseisarvomomentti, absoluuttinen momentti
 • central moment = keskusmomentti
 • moment generating function = momenttiemäfunktio
 • product moment = tulomomentti
 • sample moment = otosmomentti
Monte Carlo method = Monte Carlo -menetelmä
moving average = liukuva keskiarvo
multicollinearity = multikollineaarisuus
multidimensional scaling = moniulotteinen skaalaus
multilevel model = monitasomalli
multimodal = monihuippuinen
multinomial coefficient = multinomikerroin
multinormal distribution = multinormaalijakauma
Synonyymi: multivariate normal distribution = moniulotteinen normaalijakauma
multiple comparisions, simultaneous comparisions = monivertailu, simultaaninen vertailu
multiple correlation coefficient = yhteiskorrelaatiokerroin
multiple linear regression analysis = usean selittäjän/muuttujan lineaarinen regressioanalyysi
multiple regression = usean selittäjän regressio, moniulotteinen regressio
multiple time series = moniulotteinen aikasarja
multivariate = monimuuttujainen, monimuuttuja-, moniulotteinen
 • multivariate analysis = monimuuttuja-analyysi
 • multivariate F-distribution = moniulotteinen F-jakauma
 • multivariate normal distribution = moniulotteinen normaalijakauma, multinormaalijakauma
multivariate method = monimuuttujamenetelmä
mutually exclusive (events) = toisensa poissulkevat (tapahtumat)

N

nearest-neighbor (method) = lähinaapuri(menetelmä)
Lähinaapurimenetelmät ovat ryhmä toisilleen sukua olevia menetelmiä, joita käytetään ainakin seuraaviin tarkoituksiin: luokitteluun, tiheysfunktion estimointiin ja regressiofunktion estimointiin.
negative predited value, negative preditive value = negatiivinen ennustearvo
diagnostisen testin ominaisuus
neural computing = neuraalilaskenta
neural network = neuroverkko, hermoverkko
myös artificial neural network
noise = kohina
nominal scale = nominaaliasteikko, luokittelua., laatueroa., luokka-a.
non-central, noncentral = epäkeskinen, epäkeskeinen
 • non-central (\chi^2, t, F) distribution = epäkeskinen/epäkeskeinen (\chi^2-, t-, F-) jakauma
 • non-centrality parameter = epäkeskisyysparametri, epäkeskeisyysparametri
nonlinear = epälineaarinen
 • nonlinear regression = epälineaarinen regressio
nonparametric = parametriton, epäparametrinen, ei-parametrinen, jakaumasta riippumaton
nonresponse = (vastaus)kato
normal (adj.) = normaali-, normaalinen
käännöstä normaalinen voidaan käytettää silloin kuin normal viittaa normaalijakaumaan.
 • normal probability plot = normaalijakaumakuvio, normaalijakauman todennäköisyyskuvio
normal distribution = normaalijakauma
normal equation(s) = normaaliyhtälö(t)
nuisance parameter = kiusaparametri, haittaparametri
null hypothesis = nollahypoteesi
numerical variable = numeerinen muuttuja
synonyymi: quantitative v. = kvantitatiivinen m.

O

observation = havainto
observational study = havaintotutkimus
observational unit = havaintoyksikkö
odds = vedonlyöntikerroin, odds(-suure, -luku)
odds ratio = vedonlyöntikertoimien osamäärä, odds-suhde, odds-lukujen/odds-suureiden osamäärä/suhde, vetokertoimien suhde
one-sided = yksitahoinen
one-sided confidence interval
one-way = yksisuuntainen
one-way alternative (hypothesis) = yksisuuntainen vaihtoehtoinen (hypoteesi)
order statistic = järjestystunnusluku
ordered sample = järjestetty otos
ordinal scale = ordinaaliasteikko, järjestysasteikko
orthogonal series estimator = ortogonaalisarjaestimaattori
menetelmä(perhe) tiheys- ja regressiofunktion estimointiin
outcome = vaste, tulos, lopputulos
outlier = vieras havainto, poikkeava havainto, ulkopuolinen havainto
overfitting = ylisovittaminen

P

p-value = p-arvo, havaittu merkitsevyystaso
Synonyymejä: tarkka merkitsevyystaso; merkitsevyystodennäköisyys; signficance probability; observed significance level
paired = parittainen
paired test
parameter = parametri
 • interest parameter == parameter of interest = mielenkiintoparametri, kiinnostava parametri
 • nuisance parameter = haittaparametri, kiusaparametri
 • parameter space = parametriavaruus
 • structural parameter = rakenneparametri
parametric = parametrinen
 • parametric inference = parametrinen päättely
 • parametric model = parametrinen malli
parametrize = parametroida
parsimony = säästäväisyys, säästeliäisyys (tilastollisen mallin)
partial = osittais-, jäännös-
 • partial correlation coefficient = osittaiskorrelaatiokerroin
 • partial covariance matrix = osittais-, jäännöskovarianssimatriisi
pattern recognition = hahmontunnistus
percentile = prosenttipiste
periodogram = periodogrammi
permutation test = permutaatiotesti
pie chart = piirakkakuvio, sektoridiagrammi
pie graph = piirakkakuvio
pivotal quantity = pivot-suure, saranasuure
pivotal quantity == pivot variable
placebo = plasebo, lume-
plot (n.) = kuvio; ruutu, palsta; muita yleiskielen merkityksiä
 • box plot = laatikkokuvio
 • line plot = viivakuvio
 • point plot = pistekuvio
 • P-P plot = todennäköisyyskuvio, todennäköisyys-todennäköisyys-kuvio
 • Q-Q plot = kvantiilikuvio, kvantiili-kvantiili-kuvio
 • scatter plot = hajontakuvio, parvikuvio
plot (v.) = piirtää; muita yleiskielen merkityksiä
plug-in = sijoitus-
plug-in principle, plug-in estimator
point estimation = piste-estimointi
point process = pisteprosessi
 • marked point process = merkkinen pisteprosessi, merkitty pisteprosessi
polytomous = moniluokkainen
pooled = yhdistetty
pooled variance estimator = yhdistetty varianssiestimaattori
population = populaatio, perusjoukko
positive predited value, positive predictive value = positiivinen ennustearvo
diagnostisen testin ominaisuus
posterior = posteriori-, posteriori
 • posterior distribution = posteriorijakauma
 • posterior probability = posterioritodennäköisyys
power = potenssi
power (of a test) = (testin) voima/voimakkuus
power function = voimafunktio/voimakkuusfunktio
precision (parameter, matrix) = täsmällisyysparametri, täsmällisyysmatriisi
Normaalijakaumalle täsmällisyysparametri on varianssin käänteisluku ja täsmällisyysmatriisi on kovarianssimatriisin käänteismatriisi. Normaalijakauman parametrointi täsmällisyysmatriisin avulla on kätevää esim. lineaarisen mallin bayesläisen käsittelyn yhteydessä.
prediction = ennustaminen, ennuste
predictive = prediktiivinen, ennuste-
 • predictive distribution = prediktiivinen jakauma, ennustejakauma
 • posterior/prior predictive distribution = posterioriprediktiivinen jakauma/prioriprediktiivinen jakauma, posterioriennustejakauma/prioriennustejakauma
 • predictive model/inference = prediktiivinen malli/päättely
principal component = pääkomponentti
 • principal component analysis (PCA) = pääkomponenttianalyysi
 • principal components regression = pääkomponenttiregressio
prior = priori-, priori
 • conjugate prior = liittopriori, konjugaattipriori, liitännäispriori
 • Jeffreys' prior = Jeffreysin priori
 • noninformative prior = epäinformatiivinen priori
 • prior distribution = priorijakauma
 • prior probability = prioritodennäköisyys
 • proper/improper prior = aito/epäaito priori
 • reference prior = viitepriori
probability = todennäköisyys
 • probability density function (pdf) = (todennäköisyys)tiheysfunktio
 • probability distribution = (todennäköisyys)jakauma
 • probability (mass) function (pmf) = pistetodennäköisyysfunktio
 • probability measure = todennäköisyysmitta
 • probability model == stochastic model = todennäköisyysmalli
 • probability space = todennäköisyysavaruus, todennäköisyyskenttä
 • probability theory = todennäköisyysoppi, -teoria, -laskenta
 • total probability = kokonaistodennäköisyys
product moment = tulomementti(-)
projection pursuit = projektion haku (ei vakiintunut)
proportion = osuus, suhteellinen osuus

Q

quantile = kvantiili, fraktiili
 • empirical quantile, sample quantile = empiirinen eli otoskvantiili.
quantization = kvantisointi
quantizing = kvantisointi
quartile = kvartiili
 • interquartile range, IQR = kvartiilivälin pituus
 • lower quartile = alakvartiili, Q1
 • upper quartile = yläkvartiili, Q3
queue = jono
queueing theory = jonoteoria

R

random = satunnainen, satunnais-, stokastinen
 • random effect = satunnaisvaikutus
 • random error = satunnaisvirhe
 • random event = satunnaistapahtuma
 • random field = satunnaiskenttä
 • random number (generator) = satunnaisluku(generaattori)
 • pseudo random number = pseudo- eli näennäissatunnaisluku
 • random sample = satunnaisotos
 • random variable = satunnaismuuttuja
 • random vector = satunnaisvektori
 • random walk = satunnaiskulku
random effects model = satunnaisten vaikutusten malli
randomization = satunnaistaminen
range = (a) vaihteluväli, (b) vaihteluvälin pituus
rank = sijaluku, järjestysluku, ranki
rank correlation = järjestyskorrelaatio
rate = tiheys; osuus; aste; intensiteetti; taajuus; nopeus
Huomautus: sana rate voi eri asiayhteyksissä tarkoittaa aivan erilaisia asioita.
ratio = osamäärä, suhde
ratio scale = suhdeasteikko
regression = regressio
 • regression function = regressiofunktio
 • regression analysis = regressioanalyysi
 • regression model = regressiomalli
 • regression through the origin = regressio origon kautta
 • linear regression = lineaarinen regressio
 • multiple linear regression = usean selittäjän lineaarinen regressio
 • logistic regression = logistinen regressio
relative frequency = suhteellinen frekvenssi, suhteellinen lukumäärä, suhteellinen osuus
remote sensing = kaukokartoitus
renewal theory = uusiutumisteoria
reparametrization = uudelleenparametrointi
reparametrize = reparametroida, parametroida uudelleen
replacement = takaisinpano, palauttaminen
 • sampling with repalcement = poiminta takaisinpanolla, poiminta palauttaen
 • sampling without replacement = poiminta takaisinpanotta, poiminta ilman takaisinpanoa, poiminta palauttamatta
replicate = toisto
replication = toistaminen
resampling = uudelleenotanta, otoksen uudelleenkäyttö
residual = residuaali, jäännös
 • residual mean square = jäännösvarianssi
 • residual standard deviation = jäännöshajonta
response = (a) vaste, vastemuuttuja; (b) vastaus
response surface method = vastepintamenetelmä
reuse = uudelleenkäyttö
ridge regression = harjanneregressio
risk = riski
risk theory = riskiteoria
robust = vakaa, robusti
ROC curve, reciever operating characteristic curve = ROC-käyrä, toimintaominaiskäyrä
 • area under the ROC curve = ROC-käyrän alle jäävä pinta-ala.

S

sample (n.) = (a) otos, (b) näyte
 • sample mean = otoskeskiarvo
 • sample mean vector = otoskeskiarvovektori
 • sample moment = otosmomentti
 • sample covariance matrix = otoskovarianssimatriisi
 • sample size = otoskoko
 • sample survey = otantatutkimus
 • large/small sample theory = suurten/pienten otosten teoria
sample (v.) = poimia otos/näyte
sampler = otanta-algoritmi, näytteenottaja
 • Gibbs sampler = Gibbsin otanta-algoritmi, Gibbsin näytteenottaja
 • Metropolis--Hastings sampler = Metropolisin--Hastingsin otanta-algoritmi tai näytteenottaja
sampling = otanta, poiminta
 • sampling theory = otantateoria
 • sampling distribution = otosjakauma, otantajakauma
 • sampling fraction = otantasuhde
 • sampling with replacement = otanta takaisinpanolla, poiminta palauttaen
 • sampling without replacement = otanta takaisinpanotta, poiminta palauttamatta
 • simple random sampling (SRS) = yksinkertainen satunnaisotanta, SRS-otanta
 • systematic sampling = systemaattinen otanta
 • sampling proportional to size = otanta otsyksikön koon mukaan
 • stratified sampling = ositettu otanta
 • cluster sampling = ryväsotanta
saturated model = kyllästettu malli
scatter = hajonta, sironta
scatter plot = pistekuvio; parvikuvio, hajontakuva, -kuvio; sirontakuva, -kuvio; sirotekuva, -kuvio.
 • scatter plot matrix = hajontakuviomatriisi (tai alkuosa oman maun mukaan).
score = pistearvo, pistemäärä
score function = pistemäärä, pistemääräfunktio, pistelukufunktio (== logaritmisen uskottavuusfunktion ensimmäinen derivaatta [parametrivektorin suhteen])
seasonal effect = vuodenaikaisvaihtelu
semiparametric = semiparametrinen
sensitivity = sensitiivisyys, herkkyys
diagnostisen testin ominaisuus
sigma algebra = sigma-algebra
 • product sigma-algebra = tulosigma-algebra
sign test = merkkitesti
significance level = merkitsevyystaso
simulated annealing = simuloitu jäähdytys
simulation = simulointi
singular value decomposition = singulaariarvohajotelma
size (of a test) = (testin) riskitaso, merkitsevyystaso
 • synonyymi: significance level.
skew(ed) (distribution) = vino (jakauma)
slope = kulmakerroin
smoother = siloitin, tasoitin
smoothing = silotus, tasoitus, silottaminen, tasoittaminen
specificity = spesifisyys, tarkkuus
diagnostisen testin ominaisuus
spline = splini
 • cubic spline = kuutiosplini
 • natural spline = luonnollinen splini
 • natural cubic spline = luonnollinen kuutiosplini
 • regression spline = regressiosplini
 • interpolating spline = interpoloiva splini
 • smoothing spline = silottava splini
standard deviation = keskihajonta, standardipoikkeama
standard error, SE = keskivirhe
standard normal distribution = standardinormaalijakauma, standardoitu normaalijakauma, normitettu normaalijakauma
standardisation = normitus
stationary = stationaarinen
statistic = otossuure, tunnusluku
 • ancillary statistic = sivutunnusluku
 • descriptive statistic = kuvaileva tunnusluku
 • order statistic = järjestystunnusluku
 • sufficient statistic = tyhentävä tunnusluku
 • test statistic = testimuuttuja, -tunnusluku
statistical = tilastollinen, tilasto-
 • statistical computing = tilastollinen tietojenkäsittely
 • statistical graphics = tilastografiikka
 • statistical inference = tilastollinen päättely
 • statistical method = tilastomenetelmä, tilastollinen menetelmä
 • statistical model = tilastollinen malli
 • statistical pattern recognition = tilastollinen hahmontunnistus
 • statistical significance = tilastollinen merkitsevyys
statistics = (a) tilastotiede; (b) tilastot, tilastotiedot; (c) tilastotoimi; (d) termin statistic monikko
 • computational statistics = laskennallinen tilastotiede
 • descriptive statistics = kuvaileva tilastotiede
 • mathematical statistics = matemaattinen tilastotiede
 • official statistics = virallinen tilastotoimi, viralliset tilastot
 • spatial statistics = spatiaalinen tilastotiede
stem and leaf diagram = varsi ja lehti -esitys
stepwise = askeltava
stochastic = stokastinen, satunnais-
stochastic process = stokastinen prosessi, satunnaisprosessi
stopping time = pysäytyshetki
stopping time sigma algebra = pysäytetty historia, pysäytyshetkisigma-algebra
stratified sampling = ositettu otanta
stratum = osite
plural: strata
studentize, studentise = studentoida
Huom: erisnimistä tehdyt johdokset kirjoitetaan suomen kielessä pienellä alkukirjaimella.
sufficient statistic = tyhjentävä tunnusluku, otossuure
minimal sufficient statistic = minimaalinen tyhjentävä tunnusluku
sum of squares (SS) = neliösumma
varianssianalyysi perustuu kokonaisneliösumman hajotelmaan kahdeksi muuksi termiksi, joille eri kirjoittajat käyttävät erilaisia nimityksiä, esim. seuraavia.
 • total sum of squares (SST) = kokonaisneliösumma, selitettävän neliösumma
 • regression sum of squares = selitetty neliösumma
 • residual sum of squares (SSE, sum of squares of errors) = jäännösneliösumma
summary = tiivistelmä, yhteenveto
five point summary = viiden pisteen tiivistelmä, 5-lukuinen yhteenveto
supervised learning = ohjattu oppiminen
support vector = tukivektori
 • support vector machine = tukivektorikone
 • support vector classifier = tukivektoriluokitin
survey = selvitys, kartoitus, kysely, survey-tutkimus
survival analysis = elinaika-analyysi, eloonjäämisanalyysi, elossaoloanalyysi
survival function = elinaikafunktio, eloonjäämisfunktio, elossaolofunktio, välttöfunktio

T

tail (of a distribution) = (jakauman) häntä
tails = klaava
test = testi
test statistic = testisuure, testimuuttuja
tied values = tasatulos, sidos
time series = aikasarja
time series analysis = aikasarja-analyysi
transformation = muunnos
transition = siirtymä(-)
transition probability = siirtymätodennäköisyys
treatment = käsittely
treatment group = hoitoryhmä, koeryhmä
trend = pitkäaikaismuutos, trendi
trimmed mean = typistetty keskiarvo (ei vakiintunut), trimmattu keskiarvo
trimodal = kolmihuippuinen
truncation = typistys
two-sided = kaksitahoinen
two-sided test, two-sided confidence interval
two-tailed = kaksisuuntainen
two-tailed hypothesis
two-way = kaksisuuntainen
 • two-way alternative (hypothesis) = kaksisuuntainen vaihtoehtoinen hypoteesi
 • two-way analysis of variance = kaksisuuntainen varianssianalyysi
type I error = tyypin I virhe, hylkäysvirhe
type II error = tyypin II virhe, hyväksymisvirhe

U

unbiased = harhaton
unbiased estimator = harhaton estimaattori
uncorrelated = korreloimaton
unimodal = yksihuippuinen
unit = yksikkö
 • elementary unit = alkeisyksikkö
 • experimental unit = koeyksikkö, kokeen yksikkö
 • observational unit = havaintoyksikkö
 • population unit = populaation yksikkö
 • sampling unit = otantayksikkö
univariate = yhden muuttujan, yksiulotteinen
unsupervised learning = ohjaamaton oppiminen
utility = utiliteetti

V

validation = validointi
variable = muuttuja (subst.); muuttuva (adj.)
variance = varianssi
 • variance between groups = ryhmien välinen varianssi
 • variance within groups = ryhmien sisäinen varianssi
 • variance-covariance matrix = varianssi–kovarianssi-matriisi (lyhyemmin: kovarianssimatriisi)
variance reduction = varianssin pienentäminen
variate = muttuja

W

wavelet = aalloke, aaltonen
weighted = painotettu
 • weighted mean, w. average = painotettu keskiarvo
 • weighted sample = painotettu otos
white noise = valkoinen kohina
Wiener process = Wienerin prosessi
winsorization = winsorointi

Viitteet