Tilastotieteen ja todennäköisyyslaskennan englantilais–suomalainen sanasto
Oheisen sanaston rinnalla suosittelen käyttämään ISI:n (International Statistical Institute) sivustoa ISI glossary of statistical terms, johon on v. 2004 lisätty myös suomenkieliset termit.
A
- absolute scale = absoluuttinen asteikko
- absolutely continuous = absoluuttisesti jatkuva
- additive = additiivinen
-
- generalized additive model = yleistetty additiivinen malli
- adjusted = korjattu, vakioitu
- admissible = kelvollinen, käypä
-
- admissible estimator
- AIC, Akaike's information criterion = Akaiken informaatiokriteeri
- almost certainly = melkein varmasti
- almost everywhere = melkein kaikkialla
- almost surely = melkein varmasti
- alternative (hypothesis) = vaihtoehtoinen (hypoteesi), vaihtoehtohypoteesi
- analysis = analyysi
-
- analysis of variance (ANOVA) = varianssianalyysi
- ANOVA table = varianssitaulu
- oneway analysis of variance = yksisuuntainen varianssianalyysi
- analysis of covariance (ANCOVA) = kovarianssianalyysi
- ancillary statistic = sivutunnusluku
- arithmetic mean = (aritmeettinen) keskiarvo
- asymptotic = asymptoottinen
-
- asymptotic distribution = asymptoottinen jakauma
- asymptotic expansion = asymptoottinen kehitelmä
- asymptotic normality = asymptoottinen normaalisuus
- autocorrelation = autokorrelaatio
- autoregressive = autoregressiivinen
- average = keskiarvo
B
- bar chart = pylväskuvio, -diagrammi
- bar graph = pylväskuvio
- bar plot = pylväskuvio
- Bayes formula = Bayesin kaava
- Bayesian = bayesläinen, bayeslainen, bayesiläinen, bayesilainen, Bayes-
- esimerkkejä: Bayesian inference; Bayesian statistics. Huom: erisnimistä tehdyt johdokset kirjoitetaan suomen kielessä pienellä alkukirjaimella.
- bias = harha
-
- biased = harhainen
- unbiased = harhaton
- bimodal = kaksihuippuinen
- binomial coefficient = binomikerroin
- bioassay = biotesti
- biometrics = biometria
- biometry = biometria
- birth and death process = syntymis- ja kuolemisprosessi
- bivariate = kaksiulotteinen, kaksimuuttujainen
-
- bivariate normal distribution = kaksiulotteinen normaalijakauma
- block = lohko
- Bonferroni adjustment/correction/inequality = Bonferronin korjaus; epäyhtälö
- bootstrap = saapasremmi, -hihna, bootstrap-menetelmä
- Termi bootstrap perustuu sanontaan pull oneself up by one's bootstraps, 'tulla toimeen omin avuin', joka taas pohjautuu paroni von Münchhausenin seikkailuihin.
- bounded in probability = stokastisesti rajoitettu
- ominaisuus, joka voi olla satunnaismuuttujajonolla. Synonyymeja: stochastically bounded, tight.
- branching process = haarautumisprosessi
- Brownian motion = Brownin liike
C
- calibration = kalibrointi
- canonical correlation = kanoninen korrelaatio
- canonical correlation coefficient = kanoninen korrelaatiokerroin
- capture–recapture method = merkintä–takaisinpyynti-menetelmä, toistopyydystysotanta
- case-control study = tapaus-verrokki -asetelma t. -tutkimus
- categorical variable = kategorinen muuttuja, luokitteleva m.
- Kategorista muuttujaa mitataan luokka-asteikolla. Synonyymi: qualitative v. = kvalitatiivinen m.
- censoring = sensurointi, rajaaminen
- central limit theorem (CLT) = keskeinen raja-arvolause
- change point = muutospiste
- characteristic (n.) = ominaisuus
- characteristic function = karakteristinen funktio
- Tilastotieteessä ja todennäköisyyslaskennassa karakteristinen funktio tarkoittaa samaa kuin Fourier-muunnos. Matemaattisen analyysin harrastajan karakteristinen funktio = todennäköisyyslaskijan indikaattorifunktio.
- chi = khii
- chi square(d) = khiin neliö
- class interval = luokkaväli
- Histogrammissa.
- classification = luokittelu
- Huom: suuressa osassa kirjallisuutta termit classification, discrimination ja statistical pattern recognition ovat (lähes) synonyymeja. Tästä poiketen osa kirjoittajista käyttää termiä classification tarkoittamaan sitä asiaa, johon tavallisesti viitataan termillä clustering tai cluster analysis.
- cluster = ryhmä, ryväs, klusteri
- cluster analysis = ryhmittelyanalyysi
- clustering = (a) ryhmittelyanalyysi; (b) ryhmittely (ryhmittelyanalyysin tulos)
- coefficient of determination = selitysaste
- Käytetään lineaarisessa regressiossa; R^2 (R-squared)
- computational statistics = laskennallinen tilastotiede
- concordant = yhtäpitävä
- conditional = ehdollinen
-
- conditional expectation = ehdollinen odotusarvo
- conditional distribution = ehdollinen jakauma
- conditional probability = ehdollinen todennäköisyys
- full conditional (distribution) = täysehdollinen jakauma, täysin ehdollistettu jakauma
- conditioning = ehdollistaminen
- confidence = luottamus-
-
- confidence interval (CI) = luottamusväli
- confidence set = luottamusjoukko
- confidence level = luottamustaso
- confounder = sekoittava tekijä, sekoittaja
- consistent = tarkentuva
-
- weakly/strongly consistent estimator = heikosti/vahvasti tarkentuva estimaattori
- contingency table = kontingenssitaulu
- continuity correction = jatkuvuuskorjaus
- contrast = kontrasti
- control (n.) = säätö, kontrolli
- control group = vertailuryhmä, kontrolliryhmä
- control = kontrolli (koeyksikkö, johon ei kohdisteta tahallista käsittelyä), verrokki
- controlled experiment = kontrolloitu koe
- converge = supeta, konvergoida
-
jono satunnaismuuttujia voi supeta mm. seuraavilla tavoilla kohti
rajasatunnaismuuttujaa
- converges almost certainly = suppenee melkein varmasti
- converges almost surely = suppenee melkein varmasti
- converges in distribution = suppenee jakaumaltaan
- converges quadratically = suppenee kvadraattisesti
- converges in probability = suppenee stokastisesti
- convergence = suppeneminen, konvergenssi, konvergointi
-
- almost certain convergence = melkein varma suppeneminen
- almost sure convergence = melkein varma suppeneminen
- convergence in distribution = jakaumasuppeneminen
- convergence in probability = stokastinen suppeneminen
- quadratic convergence = kvadraattinen suppeneminen
- correlation = korrelaatio
-
- correlation coefficient = korrelaatiokerroin
- correlation matrix = korrelaatiomatriisi
- correspondence analysis = korrespondenssianalyysi
- counting process = laskuriprosessi
- covariance = kovarianssi
- covariance matrix = kovarianssimatriisi
- covariate = kovariaatti
- Cramér–Rao lower bound = Cramérin–Raon alaraja
- credible interval = bayesläinen luottamusväli, Bayes-luottamusväli
- critical = kriittinen
-
Esiintyy testien yhteydessä:
- critical region = kriittinen alue, hylkäysalue
- critical value = kriittinen arvo
- cross-sectional = poikittais-
- cross-tabulation = ristiintaulukointi
- cross-validation = ristiinvalidointi
-
Muita ehdotuksia:
ristiin varmistus/vahvistus/tarkistus/testaus
- leave-one-out cross-validation = yksi-pois -ristiinvalidointi
- v-fold cross-validation = v-kertainen ristiinvalidointi
- cumulant = kumulantti
- cumulant generating function = kumulanttiemäfunktio
- cumulative distribution function (cdf, CDF) = kertymäfunktio
- Synonyymi distribution function on hyvin yleinen
- cumulative frequency = summafrekvenssi
- cumulative frequency polygon == ogive = summakäyrä
- curse of dimensionality = dimensiokirous, dimensioiden kirous
- cut point = katkaisupiste, kynnysarvo
- cyclic change = toistuva vaihtelu, kausivaihtelu
D
- data = data, (havainto)aineisto
- Huom: data on englannin kielessä monikkomuoto; yksikkö on datum.
- data analysis = data-analyysi
- J. Tukeyn käyttöön ottamalle erottelulle confirmatory data analysis / exploratory data analysis (EDA) ei näytä olevan vakiintunutta käännöstä. Laiskan ihmisen käännös: konfirmatorinen/eksploratiivinen data-analyysi.
- data augmentation = aineiston täydennys(menetelmä)/täydentämis(menetelmä)
- data generating process = aineiston tuottanut prosessi, aineistoa tuottava prosessi
- data matrix = havaintomatriisi
- data mining = tiedon louhinta
- decision theory = päätösteoria, päätäntäteoria
- decision tree = päätöspuu
- degrees of freedom (df) = vapausaste(-luku)
-
Esimerkkejä:
- chi-squared distribution with q degrees of freedom = \chi^2-jakauma vapausasteilla q, \chi^2-jakauma q vapausasteella
- F-distribution with m and k degrees of freedom = F-jakauma vapausastein m, k
- approximate degrees of freedom = approksimoidut vapausasteet
- delta method = delta-menetelmä
- Taylorin kehitelmään perustuva menetelmä estimaattorin asymptoottisen jakauman löytämiseksi
- density estimation = tiheysfunktion estimointi
- density function = tiheysfunktio
- dependency = riippuvuus
- dependent variable = riippuva muuttuja, selitettävä muuttuja, vaste (regressiossa)
- Dependent variable == response
- descriptive statistics = kuvaileva tilastotiede
- design = (koe)asetelma
- design of experiments = koesuunnittelu, kokeiden suunnittelu
- deterministic = deterministinen
- deviance = devianssi
- diagnostics = diagnostiikka
- diagram = kuvio, diagrammi, diagramma
- dichotomous variable = dikotominen muuttuja, binäärimuuttuja
- diffusion process = diffuusioprosessi
- dimension reduction = ulotteisuuden pienentäminen, dimension pienentäminen
- dimensionality = ulotteisuus
- directed acyclic graph, DAG = suunnattu asyklinen verkko
- discrete = diskreetti
- discrete distribution = diskreetti jakauma
- discriminant analysis = erotteluanalyysi
- discrimination = erottelu
- distribution = jakauma
-
- Bernoulli d. = Bernoullin j., Bernoulli-j.
- beta d. = beetaj., betaj.
- binomial d. = binomij.
- chi-squared d. = khiin neliön j.
- Dirichlet d. = Dirichletin j.
- exponential d. = eksponenttij.
- negative exponential d. == exponential d. (synonyymejä!)
- double exponential d. = kaksitahoinen eksponenttij., kaksoiseksponenttij., Laplacen jakauma
- gamma d. = gammaj.
- inverse gamma d. == inverted gamma d. = käänteinen gammaj. (gammamuuttujan käänteisarvon jakauma)
- (Fisher's) F-d. = (Fisherin) F-jakauma
- geometric d. = geometrinen j.
- hypergeometric d. = hypergeometrinen j.
- multinomial d. = multinomij.
- normal d. = normaalij.
- multivariate normal d. == multinormal d. = moniulotteinen normaalij., multinormaalij.
- logistic d. = logistinen j.
- lognormal d. = lognormaalinen j.
- negative binomial d. = negatiivinen binomij.
- Pareto d. = Pareton j.
- Poisson d. = Poissonin j., Poisson-j.
- standard normal d. = normitettu normaalij., standardinormaalij.
- (Student's) t-d. = (Studentin) t-j., Studentin j.
- trinomial d. = trinomij.
- uniform d. = tasaj., tasainen j.
- Wishart d. = Wishartin j.
- distribution free = jakaumasta riippumaton
- distribution function = kertymäfunktio
- synonyymi: cumulative distribution function, cdf, CDF
- double blind = kaksoissokko-
- double blind experiment = kaksoissokkokoe
- draftsmans's display, draftsman's plot = ks. scatter plot matrix
- draughtsman's display, draughtsman's plot = ks. scatter plot matrix
- dummy variable = indikaattorimuuttuja, osoitinmuuttuja, dummy-muuttuja
E
- efficient = tehokas
- efficiency = tehokkuus; fully efficient = täystehokas
- EM algorithm (expectation–maximization algorithm) = EM-algoritmi
- empirical = empiirinen, kokemusperäinen
-
- empirical distribution = empiirinen jakauma
- empirical (cumulative) distribution function = empiirinen kertymäfunktio
- empirical measure = empiirinen mitta
- empirical probability = empiirinen todennäköisyys
- entropy = entropia
- maximum entropy method = suurimman entropian menetelmä
- ergodic = ergodinen
- error of the first kind = hylkäysvirhe, ensimmäisen lajin virhe
- error of the second kind = hyväksymisvirhe, toisen lajin virhe
- estimate (n.) = estimaatti, arvio
-
- interval estimate = väliestimaatti
- least squares estimate (LSE) = pienimmän neliösumman estimaatti
- maximum a posteriori estimate, MAP estimate = MAP-estimaatti, posteriorijakauman moodi
- maximum likelihood estimate (MLE) = suurimman uskottavuuden estimaatti
- point estimate = piste-estimaatti
- estimate (v.) = estimoida, arvioida
- estimation = estimointi
-
- point estimation = piste-estimointi;
- interval estimation = väliestimointi
- estimator = estimaattori, arvio (satunnaismuuttujana)
- ks. kohdan estimate (n.) esimerkkejä.
- exchangeable = vaihdannainen, vaihdettava
- Synonyymi: interchangable. Vaihdannaisuus on (äärellisen tai äärettömän) satunnaismuuttujajonon jakauman ominaisuus.
- expectation = odotusarvo
- expected value = odotusarvo
- experiment = koe
-
- experimental design = koesuunnitelma; kokeen suunnittelu
- experimental unit = koeyksikkö
- explanatory variable = selittävä muuttuja, selittäjä, riippumaton muuttuja (regressiossa)
- explanatory variable == independent variable, regressor
- exploratory = kartoittava, etsivä, ekspolratiivinen
- exponential = eksponentti(-)
-
- exponential function = eksponenttifunktio
- exponential family = eksponenttiperhe
- scaled exponential family = skaalattu eksponenttiperhe
- extrapolation = ekstrapolaatio
F
- factor = faktori, tekijä
-
- factor analysis = faktorianalyysi
- common factor = yhteisfaktori
- special factor = ominaisfaktori
- factorial experiment = faktorikoe, yhdistelykoe
- failure = vika-, vikaantuminen, viottuminen
-
- failure time = vikaantumisaika
- failure rate == hazard rate = vikataajuus, vikatiheys, vioittuvuus
- filter = suodin, suodatin
- linear filter = lineaarinen suodin
- filtration = historia
- historia on kasvava perhe sigma-algebroja.
- fit (n.) = (a) sovite; (b) yhteensopivuus
- fit (v.) = sovittaa
- fitted value = sovite
- fixed effects model = kiinteiden vaikutusten malli
- forecast = ennustaa, ennuste
- fractile = fraktiili, kvantiili
- frequency = (1) lukumäärä, frekvenssi; (2) taajuus
-
- frequency polygon = frekvenssimonikulmio, frekvenssikäyrä
- relative frequency = suhteellinen frekvenssi
G
- game theory = peliteoria
- generalized additive model, GAM = yleistetty additiivinen malli
- generalized linear model, GLM = yleistetty lineaarinen malli
- generating function = generoiva funktio, emäfunktio
- genetic algorithm = geneettinen algoritmi
- geometric mean = geometrinen keskiarvo, keskiverto
- goodness of fit = yhteensopivuus
- graph = (a) kuvio, piirros; (b) verkko, graafi
- graphical display = graafinen esitys, graafinen esittäminen
- graphical model = graafinen malli
- sana graphical viittaa tässä termissä graafeihin.
H
- harmonic mean = harmoninen keskiarvo
- hazard function, hazard rate = hasardifunktio, riskifunktio, vaarafunktio
- heads = kruuna
- Hessian (matrix) = Hessen matriisi
- heteroscedastic = heteroskedastinen, erivarianssinen
- hidden Markov model, HMM = kätketty Markovin malli, piilotettu Markovin malli (ei vakiintunut)
- histogram = histogrammi, histogramma
-
- frequency histogram = frekvenssihistogrammi
- density histogram = tiheyshistogrammi
- homoscedastic = homoskedastinen, vakiovarianssinen
- hypothesis = hypoteesi
-
- hypothesis testing = hypoteesin testaus
- null hypothesis = nollahypoteesi
- alternative hypothesis = vaihtoehtoinen hypoteesi
- simple hypothesis = täysin määrätty hypoteesi
- composite hypothesis = osittain määrätty hypoteesi
I
- i.i.d. = riippumaton ja samoin jakautunut
- Tällainen ominaisuus voi olla jonolla satunnaismuuttujia (tai muita satunnaisalkioita: satunnaisvektoreita, satunnaismatriiseja, ...). Lyhenne i.i.d. tulee sanoista independent, identically distributed.
- identifiable = identifioituva
- image analysis = kuva-analyysi
- image processing = kuvankäsittely
- imputation = paikkaaminen, paikkaus, puuttuvien tietojen korvaaminen
- independent = riipumaton
- indicator variable = indikaattorimuuttuja , osoitinmuuttuja, ilmaisinmuuttuja
- indicator variable == dummy variable
- indistinguishable = erottamaton
- kaksi stokastista prosessia voivat olla erottamattomia.
- inference = päättely
- inferential statistics = tilastollinen päättely, tilastollinen inferenssi
- influence function = influenssifunktio
- information = informaatio
-
- observed information = havaittu informaatio
- expected information = odotettu informaatio eli Fisherin informaatio
- Fisher's information (matrix) = Fisherin informaatio(matriisi)
- information theory = informaatioteoria
- interaction = yhteisvaikutus, yhdysvaikutus
- intercept = (regressioyhtälön) vakiotermi, (suoran ja y-akselin välinen) leikkauspiste
- intergrable = integroituva
- interquartile range = kvartiilivälin pituus
- interval estimation = väliestimointi
- interval scale = intervalliasteikko, väliasteikko, välimatka-asteikko
- iteratively reweighted least squares = iteratiivinen painotettu pienimmän neliösumman menetelmä
J
- jackknife = linkkuveitsi(menetelmä), jacknife-menetelmä
- Termi viittaa kyseisen menetelmän yleiskäyttöisyyteen ja siihen, että menetelmä ei missään käyttötarkoituksessaan välttämättä ole paras mahdollinen.
- Jacobian (matrix) = Jacobin matriisi, funktionaalimatriisi
- joint distribution = yhteisjakauma
K
- kernel estimate = ydinestimaatti
-
menetelmä(perhe) parametrittomaan tiheysfunktion ja regressiofunktion estimointiin
- kernel density estimate = tiheysfunktion ydinestimaatti
- kernel regression estimate = regressiofunktion ydinestimaatti, ydinregressioestimaatti (termillä viitataan esim. Nadarayan—Watsonin estimaattoriin)
- kriging = kriging-menetelmä
- Kronecker product = Kroneckerin (matriisi)tulo
- kurtosis = huipukkuus
-
- leptokurtic = huipukkaampi (terävämpi) kuin normaalijakauma
- platykurtic = latteampi kuin normaalijakauma
- mesokurtic = yhtä huipukas kuin normaalijakauma
L
- lag = viive
- large sample method/theory = suurten otosten mentelmä/teoria
- latent variable = latentti muuttuja, piilomuuttuja
- Latin square = latinalainen neliö
- law of large numbers = suurten lukujen laki
-
- strong law of large numbers (SLLN) = vahva suurten lukujen laki
- weak law of large numbers (WLLN) = heikko suurten lukujen laki
- law of the iterated logarithm (LIL) = iteroidun logaritmin laki
- legend = selite
- likelihood = uskottavuus
-
- likelihood function = uskottavuusfunktio
- likelihood ratio = uskottavuusosamäärä
- likelihood ratio test = uskottavuusosamäärätesti
- maximum likelihood estimate/estimator (MLE) = suurimman uskottavuuden estimaatti/estimaattori
- log-likelihood function = logaritminen uskottavuusfunktio, logaritmoitu uskottavuusfunktio, log-uskottavuusfunktio, uskottavuusfunktion logaritmi
- profile likelihood function = profiiliuskottavuusfunktio
- profile log-likelihood function = profiili-log-uskottavuusfunktio
- linear model = lineaarinen malli, lineaarimalli
- linear regression = lineaarinen regressio, lineaariregressio
- link (function) = linkkifunktio
- canonical link function = kanoninen linkkifunktio
- loading = lataus
- local linear regression = lokaali lineaarinen regressio
- local polynomial regression = lokaali polynomiregressio, lokaali polynominen regressio
- logistic = logistinen
- logistic regression = logistinen regressio
- logit transformation = logit-muunnos
- longitudinal = pitkittäis-
-
- longitudinal data = pitkittäisaineisto
- loss = tappio, hukka
-
- loss function = tappiofunktio
- quadratic loss(function) = kvadraattinen tappio(funktio)
M
- machine learning = koneoppiminen
- Mahalanobis distance = Mahalanobisin etäisyys, Mahalanobis-etäisyys
- marginal distribution = reunajakauma
- Markov chain = Markovin ketju
- Markov chain Monte Carlo method (MCMC method) = Markovin ketju Monte Carlo -menetelmä, MCMC-menetelmä
- Markovin ketjujen simulointiin perustuva Monte Carlo -menetelmä
- Markov process = Markovin prosessi
- martingale = martingaali
-
- semimartingale = semimartingaali
- submartingale = alimartingaali
- supermartingale = ylimartingaali
- reversed martingale = takaperoinen martingaali
- mass function = pistetodennäköisyysfunktio
- lyhenne termistä probability mass function (pmf)
- maximum likelihood estimate (MLE) = suurimman uskottavuuden estimaatti, SU-estimaatti
- maximum likelihood method (ML method) = suurimman uskottavuuden menetelmä
- mean deviation = keskipoikkeama
- mean square(d) error (MSE) = keskineliövirhe, keskimääräinen neliövirhe, keskineliöpoikkeama
-
- root mean square(d) error (RMSE) = keskineliövirheen neliöjuuri
- mean integrated square(d) error (MISE) = integroitu keskineliövirhe
- measurable = mitallinen
- measure = mitta
-
- probability measure = todennäköisyysmitta
- counting measure = laskurimitta, lukumäärämitta
- signed measure = merkkinen mitta
- complex measure = kompleksimitta
- product measure = tulomitta
- measure theory = mittateoria
- measures of central tendency = keskiluvut
- measures of dispersion and variability = hajontaluvut
- measurment scale = mitta-asteikko
- median = mediaani
- meta-analysis = meta-analyysi
- method = menetelmä
-
- method of moments = momenttimenetelmä
- method of least squares == least squares method = pienimmän neliösumman menetelmä
- method of maximum likelihood == maximum likelihood method (ML method) = suurimman uskottavuuden menetelmä
- missing data = puuttuvat tiedot
- mixed model = sekamalli
- mixing (adj.) = sekoittuva
- satunnaismuuttujajonon (jakauman) ominaisuus
- mixture = sekoite(-), sekoitus(-)
-
- mixture distribution = sekajakauma, sekoitejakauma, sekoitusjakauma
- mixture model = sekoitemalli
- mode = moodi, tyyppiarvo
- model = malli
-
- model averaging = mallien keskiarvoistaminen
- model selection = mallinvalinta
- modeling = mallintaminen
- moment = momentti
-
- absolute moment = itseisarvomomentti, absoluuttinen momentti
- central moment = keskusmomentti
- moment generating function = momenttiemäfunktio
- product moment = tulomomentti
- sample moment = otosmomentti
- Monte Carlo method = Monte Carlo -menetelmä
- moving average = liukuva keskiarvo
- multicollinearity = multikollineaarisuus
- multidimensional scaling = moniulotteinen skaalaus
- multilevel model = monitasomalli
- multimodal = monihuippuinen
- multinomial coefficient = multinomikerroin
- multinormal distribution = multinormaalijakauma
- Synonyymi: multivariate normal distribution = moniulotteinen normaalijakauma
- multiple comparisions, simultaneous comparisions = monivertailu, simultaaninen vertailu
- multiple correlation coefficient = yhteiskorrelaatiokerroin
- multiple linear regression analysis = usean selittäjän/muuttujan lineaarinen regressioanalyysi
- multiple regression = usean selittäjän regressio, moniulotteinen regressio
- multiple time series = moniulotteinen aikasarja
- multivariate = monimuuttujainen, monimuuttuja-, moniulotteinen
-
- multivariate analysis = monimuuttuja-analyysi
- multivariate F-distribution = moniulotteinen F-jakauma
- multivariate normal distribution = moniulotteinen normaalijakauma, multinormaalijakauma
- multivariate method = monimuuttujamenetelmä
- mutually exclusive (events) = toisensa poissulkevat (tapahtumat)
N
- nearest-neighbor (method) = lähinaapuri(menetelmä)
- Lähinaapurimenetelmät ovat ryhmä toisilleen sukua olevia menetelmiä, joita käytetään ainakin seuraaviin tarkoituksiin: luokitteluun, tiheysfunktion estimointiin ja regressiofunktion estimointiin.
- negative predited value, negative preditive value = negatiivinen ennustearvo
- diagnostisen testin ominaisuus
- neural computing = neuraalilaskenta
- neural network = neuroverkko, hermoverkko
- myös artificial neural network
- noise = kohina
- nominal scale = nominaaliasteikko, luokittelua., laatueroa., luokka-a.
- non-central, noncentral = epäkeskinen, epäkeskeinen
-
- non-central (\chi^2, t, F) distribution = epäkeskinen/epäkeskeinen (\chi^2-, t-, F-) jakauma
- non-centrality parameter = epäkeskisyysparametri, epäkeskeisyysparametri
- nonlinear = epälineaarinen
-
- nonlinear regression = epälineaarinen regressio
- nonparametric = parametriton, epäparametrinen, ei-parametrinen, jakaumasta riippumaton
- nonresponse = (vastaus)kato
- normal (adj.) = normaali-, normaalinen
-
käännöstä normaalinen voidaan käytettää silloin kuin
normal viittaa
normaalijakaumaan.
- normal probability plot = normaalijakaumakuvio, normaalijakauman todennäköisyyskuvio
- normal distribution = normaalijakauma
- normal equation(s) = normaaliyhtälö(t)
- nuisance parameter = kiusaparametri, haittaparametri
- null hypothesis = nollahypoteesi
- numerical variable = numeerinen muuttuja
- synonyymi: quantitative v. = kvantitatiivinen m.
O
- observation = havainto
- observational study = havaintotutkimus
- observational unit = havaintoyksikkö
- odds = vedonlyöntikerroin, odds(-suure, -luku)
- odds ratio = vedonlyöntikertoimien osamäärä, odds-suhde, odds-lukujen/odds-suureiden osamäärä/suhde, vetokertoimien suhde
- one-sided = yksitahoinen
- one-sided confidence interval
- one-way = yksisuuntainen
- one-way alternative (hypothesis) = yksisuuntainen vaihtoehtoinen (hypoteesi)
- order statistic = järjestystunnusluku
- ordered sample = järjestetty otos
- ordinal scale = ordinaaliasteikko, järjestysasteikko
- orthogonal series estimator = ortogonaalisarjaestimaattori
- menetelmä(perhe) tiheys- ja regressiofunktion estimointiin
- outcome = vaste, tulos, lopputulos
- outlier = vieras havainto, poikkeava havainto, ulkopuolinen havainto
- overfitting = ylisovittaminen
P
- p-value = p-arvo, havaittu merkitsevyystaso
- Synonyymejä: tarkka merkitsevyystaso; merkitsevyystodennäköisyys; signficance probability; observed significance level
- paired = parittainen
- paired test
- parameter = parametri
-
- interest parameter == parameter of interest = mielenkiintoparametri, kiinnostava parametri
- nuisance parameter = haittaparametri, kiusaparametri
- parameter space = parametriavaruus
- structural parameter = rakenneparametri
- parametric = parametrinen
-
- parametric inference = parametrinen päättely
- parametric model = parametrinen malli
- parametrize = parametroida
- parsimony = säästäväisyys, säästeliäisyys (tilastollisen mallin)
- partial = osittais-, jäännös-
-
- partial correlation coefficient = osittaiskorrelaatiokerroin
- partial covariance matrix = osittais-, jäännöskovarianssimatriisi
- pattern recognition = hahmontunnistus
- percentile = prosenttipiste
- periodogram = periodogrammi
- permutation test = permutaatiotesti
- pie chart = piirakkakuvio, sektoridiagrammi
- pie graph = piirakkakuvio
- pivotal quantity = pivot-suure, saranasuure
- pivotal quantity == pivot variable
- placebo = plasebo, lume-
- plot (n.) = kuvio; ruutu, palsta; muita yleiskielen merkityksiä
-
- box plot = laatikkokuvio
- line plot = viivakuvio
- point plot = pistekuvio
- P-P plot = todennäköisyyskuvio, todennäköisyys-todennäköisyys-kuvio
- Q-Q plot = kvantiilikuvio, kvantiili-kvantiili-kuvio
- scatter plot = hajontakuvio, parvikuvio
- plot (v.) = piirtää; muita yleiskielen merkityksiä
- plug-in = sijoitus-
- plug-in principle, plug-in estimator
- point estimation = piste-estimointi
- point process = pisteprosessi
-
- marked point process = merkkinen pisteprosessi, merkitty pisteprosessi
- polytomous = moniluokkainen
- pooled = yhdistetty
- pooled variance estimator = yhdistetty varianssiestimaattori
- population = populaatio, perusjoukko
- positive predited value, positive predictive value = positiivinen ennustearvo
- diagnostisen testin ominaisuus
- posterior = posteriori-, posteriori
-
- posterior distribution = posteriorijakauma
- posterior probability = posterioritodennäköisyys
- power = potenssi
- power (of a test) = (testin) voima/voimakkuus
- power function = voimafunktio/voimakkuusfunktio
- precision (parameter, matrix) = täsmällisyysparametri, täsmällisyysmatriisi
- Normaalijakaumalle täsmällisyysparametri on varianssin käänteisluku ja täsmällisyysmatriisi on kovarianssimatriisin käänteismatriisi. Normaalijakauman parametrointi täsmällisyysmatriisin avulla on kätevää esim. lineaarisen mallin bayesläisen käsittelyn yhteydessä.
- prediction = ennustaminen, ennuste
- predictive = prediktiivinen, ennuste-
-
- predictive distribution = prediktiivinen jakauma, ennustejakauma
- posterior/prior predictive distribution = posterioriprediktiivinen jakauma/prioriprediktiivinen jakauma, posterioriennustejakauma/prioriennustejakauma
- predictive model/inference = prediktiivinen malli/päättely
- principal component = pääkomponentti
-
- principal component analysis (PCA) = pääkomponenttianalyysi
- principal components regression = pääkomponenttiregressio
- prior = priori-, priori
-
- conjugate prior = liittopriori, konjugaattipriori, liitännäispriori
- Jeffreys' prior = Jeffreysin priori
- noninformative prior = epäinformatiivinen priori
- prior distribution = priorijakauma
- prior probability = prioritodennäköisyys
- proper/improper prior = aito/epäaito priori
- reference prior = viitepriori
- probability = todennäköisyys
-
- probability density function (pdf) = (todennäköisyys)tiheysfunktio
- probability distribution = (todennäköisyys)jakauma
- probability (mass) function (pmf) = pistetodennäköisyysfunktio
- probability measure = todennäköisyysmitta
- probability model == stochastic model = todennäköisyysmalli
- probability space = todennäköisyysavaruus, todennäköisyyskenttä
- probability theory = todennäköisyysoppi, -teoria, -laskenta
- total probability = kokonaistodennäköisyys
- product moment = tulomementti(-)
- projection pursuit = projektion haku (ei vakiintunut)
- proportion = osuus, suhteellinen osuus
Q
- quantile = kvantiili, fraktiili
-
- empirical quantile, sample quantile = empiirinen eli otoskvantiili.
- quantization = kvantisointi
- quantizing = kvantisointi
- quartile = kvartiili
-
- interquartile range, IQR = kvartiilivälin pituus
- lower quartile = alakvartiili, Q1
- upper quartile = yläkvartiili, Q3
- queue = jono
- queueing theory = jonoteoria
R
- random = satunnainen, satunnais-, stokastinen
-
- random effect = satunnaisvaikutus
- random error = satunnaisvirhe
- random event = satunnaistapahtuma
- random field = satunnaiskenttä
- random number (generator) = satunnaisluku(generaattori)
- pseudo random number = pseudo- eli näennäissatunnaisluku
- random sample = satunnaisotos
- random variable = satunnaismuuttuja
- random vector = satunnaisvektori
- random walk = satunnaiskulku
- random effects model = satunnaisten vaikutusten malli
- randomization = satunnaistaminen
- range = (a) vaihteluväli, (b) vaihteluvälin pituus
- rank = sijaluku, järjestysluku, ranki
- rank correlation = järjestyskorrelaatio
- rate = tiheys; osuus; aste; intensiteetti; taajuus; nopeus
- Huomautus: sana rate voi eri asiayhteyksissä tarkoittaa aivan erilaisia asioita.
- ratio = osamäärä, suhde
- ratio scale = suhdeasteikko
- regression = regressio
-
- regression function = regressiofunktio
- regression analysis = regressioanalyysi
- regression model = regressiomalli
- regression through the origin = regressio origon kautta
- linear regression = lineaarinen regressio
- multiple linear regression = usean selittäjän lineaarinen regressio
- logistic regression = logistinen regressio
- relative frequency = suhteellinen frekvenssi, suhteellinen lukumäärä, suhteellinen osuus
- remote sensing = kaukokartoitus
- renewal theory = uusiutumisteoria
- reparametrization = uudelleenparametrointi
- reparametrize = reparametroida, parametroida uudelleen
- replacement = takaisinpano, palauttaminen
-
- sampling with repalcement = poiminta takaisinpanolla, poiminta palauttaen
- sampling without replacement = poiminta takaisinpanotta, poiminta ilman takaisinpanoa, poiminta palauttamatta
- replicate = toisto
- replication = toistaminen
- resampling = uudelleenotanta, otoksen uudelleenkäyttö
- residual = residuaali, jäännös
-
- residual mean square = jäännösvarianssi
- residual standard deviation = jäännöshajonta
- response = (a) vaste, vastemuuttuja; (b) vastaus
- response surface method = vastepintamenetelmä
- reuse = uudelleenkäyttö
- ridge regression = harjanneregressio
- risk = riski
- risk theory = riskiteoria
- robust = vakaa, robusti
- ROC curve, reciever operating characteristic curve = ROC-käyrä, toimintaominaiskäyrä
-
- area under the ROC curve = ROC-käyrän alle jäävä pinta-ala.
S
- sample (n.) = (a) otos, (b) näyte
-
- sample mean = otoskeskiarvo
- sample mean vector = otoskeskiarvovektori
- sample moment = otosmomentti
- sample covariance matrix = otoskovarianssimatriisi
- sample size = otoskoko
- sample survey = otantatutkimus
- large/small sample theory = suurten/pienten otosten teoria
- sample (v.) = poimia otos/näyte
- sampler = otanta-algoritmi, näytteenottaja
- Gibbs sampler = Gibbsin otanta-algoritmi, Gibbsin näytteenottaja
- Metropolis--Hastings sampler = Metropolisin--Hastingsin otanta-algoritmi tai näytteenottaja
- sampling = otanta, poiminta
-
- sampling theory = otantateoria
- sampling distribution = otosjakauma, otantajakauma
- sampling fraction = otantasuhde
- sampling with replacement = otanta takaisinpanolla, poiminta palauttaen
- sampling without replacement = otanta takaisinpanotta, poiminta palauttamatta
- simple random sampling (SRS) = yksinkertainen satunnaisotanta, SRS-otanta
- systematic sampling = systemaattinen otanta
- sampling proportional to size = otanta otsyksikön koon mukaan
- stratified sampling = ositettu otanta
- cluster sampling = ryväsotanta
- saturated model = kyllästettu malli
- scatter = hajonta, sironta
- scatter plot = pistekuvio; parvikuvio, hajontakuva, -kuvio; sirontakuva, -kuvio; sirotekuva, -kuvio.
-
- scatter plot matrix = hajontakuviomatriisi (tai alkuosa oman maun mukaan).
- score = pistearvo, pistemäärä
- score function = pistemäärä, pistemääräfunktio, pistelukufunktio (== logaritmisen uskottavuusfunktion ensimmäinen derivaatta [parametrivektorin suhteen])
- seasonal effect = vuodenaikaisvaihtelu
- semiparametric = semiparametrinen
- sensitivity = sensitiivisyys, herkkyys
- diagnostisen testin ominaisuus
- sigma algebra = sigma-algebra
-
- product sigma-algebra = tulosigma-algebra
- sign test = merkkitesti
- significance level = merkitsevyystaso
- simulated annealing = simuloitu jäähdytys
- simulation = simulointi
- singular value decomposition = singulaariarvohajotelma
- size (of a test) = (testin) riskitaso, merkitsevyystaso
-
- synonyymi: significance level.
- skew(ed) (distribution) = vino (jakauma)
- slope = kulmakerroin
- smoother = siloitin, tasoitin
- smoothing = silotus, tasoitus, silottaminen, tasoittaminen
- specificity = spesifisyys, tarkkuus
- diagnostisen testin ominaisuus
- spline = splini
-
- cubic spline = kuutiosplini
- natural spline = luonnollinen splini
- natural cubic spline = luonnollinen kuutiosplini
- regression spline = regressiosplini
- interpolating spline = interpoloiva splini
- smoothing spline = silottava splini
- standard deviation = keskihajonta, standardipoikkeama
- standard error, SE = keskivirhe
- standard normal distribution = standardinormaalijakauma, standardoitu normaalijakauma, normitettu normaalijakauma
- standardisation = normitus
- stationary = stationaarinen
- statistic = otossuure, tunnusluku
-
- ancillary statistic = sivutunnusluku
- descriptive statistic = kuvaileva tunnusluku
- order statistic = järjestystunnusluku
- sufficient statistic = tyhentävä tunnusluku
- test statistic = testimuuttuja, -tunnusluku
- statistical = tilastollinen, tilasto-
-
- statistical computing = tilastollinen tietojenkäsittely
- statistical graphics = tilastografiikka
- statistical inference = tilastollinen päättely
- statistical method = tilastomenetelmä, tilastollinen menetelmä
- statistical model = tilastollinen malli
- statistical pattern recognition = tilastollinen hahmontunnistus
- statistical significance = tilastollinen merkitsevyys
- statistics = (a) tilastotiede; (b) tilastot, tilastotiedot; (c) tilastotoimi; (d) termin statistic monikko
-
- computational statistics = laskennallinen tilastotiede
- descriptive statistics = kuvaileva tilastotiede
- mathematical statistics = matemaattinen tilastotiede
- official statistics = virallinen tilastotoimi, viralliset tilastot
- spatial statistics = spatiaalinen tilastotiede
- stem and leaf diagram = varsi ja lehti -esitys
- stepwise = askeltava
- stochastic = stokastinen, satunnais-
- stochastic process = stokastinen prosessi, satunnaisprosessi
- stopping time = pysäytyshetki
- stopping time sigma algebra = pysäytetty historia, pysäytyshetkisigma-algebra
- stratified sampling = ositettu otanta
- stratum = osite
- plural: strata
- studentize, studentise = studentoida
- Huom: erisnimistä tehdyt johdokset kirjoitetaan suomen kielessä pienellä alkukirjaimella.
- sufficient statistic = tyhjentävä tunnusluku, otossuure
- minimal sufficient statistic = minimaalinen tyhjentävä tunnusluku
- sum of squares (SS) = neliösumma
-
varianssianalyysi perustuu kokonaisneliösumman hajotelmaan kahdeksi
muuksi termiksi, joille eri kirjoittajat käyttävät erilaisia nimityksiä, esim.
seuraavia.
- total sum of squares (SST) = kokonaisneliösumma, selitettävän neliösumma
- regression sum of squares = selitetty neliösumma
- residual sum of squares (SSE, sum of squares of errors) = jäännösneliösumma
- summary = tiivistelmä, yhteenveto
- five point summary = viiden pisteen tiivistelmä, 5-lukuinen yhteenveto
- supervised learning = ohjattu oppiminen
- support vector = tukivektori
-
- support vector machine = tukivektorikone
- support vector classifier = tukivektoriluokitin
- survey = selvitys, kartoitus, kysely, survey-tutkimus
- survival analysis = elinaika-analyysi, eloonjäämisanalyysi, elossaoloanalyysi
- survival function = elinaikafunktio, eloonjäämisfunktio, elossaolofunktio, välttöfunktio
T
- tail (of a distribution) = (jakauman) häntä
- tails = klaava
- test = testi
- test statistic = testisuure, testimuuttuja
- tied values = tasatulos, sidos
- time series = aikasarja
- time series analysis = aikasarja-analyysi
- transformation = muunnos
- transition = siirtymä(-)
- transition probability = siirtymätodennäköisyys
- treatment = käsittely
- treatment group = hoitoryhmä, koeryhmä
- trend = pitkäaikaismuutos, trendi
- trimmed mean = typistetty keskiarvo (ei vakiintunut), trimmattu keskiarvo
- trimodal = kolmihuippuinen
- truncation = typistys
- two-sided = kaksitahoinen
- two-sided test, two-sided confidence interval
- two-tailed = kaksisuuntainen
- two-tailed hypothesis
- two-way = kaksisuuntainen
-
- two-way alternative (hypothesis) = kaksisuuntainen vaihtoehtoinen hypoteesi
- two-way analysis of variance = kaksisuuntainen varianssianalyysi
- type I error = tyypin I virhe, hylkäysvirhe
- type II error = tyypin II virhe, hyväksymisvirhe
U
- unbiased = harhaton
- unbiased estimator = harhaton estimaattori
- uncorrelated = korreloimaton
- unimodal = yksihuippuinen
- unit = yksikkö
-
- elementary unit = alkeisyksikkö
- experimental unit = koeyksikkö, kokeen yksikkö
- observational unit = havaintoyksikkö
- population unit = populaation yksikkö
- sampling unit = otantayksikkö
- univariate = yhden muuttujan, yksiulotteinen
- unsupervised learning = ohjaamaton oppiminen
- utility = utiliteetti
V
- validation = validointi
- variable = muuttuja (subst.); muuttuva (adj.)
- variance = varianssi
-
- variance between groups = ryhmien välinen varianssi
- variance within groups = ryhmien sisäinen varianssi
- variance-covariance matrix = varianssi–kovarianssi-matriisi (lyhyemmin: kovarianssimatriisi)
- variance reduction = varianssin pienentäminen
- variate = muttuja
W
- wavelet = aalloke, aaltonen
- weighted = painotettu
-
- weighted mean, w. average = painotettu keskiarvo
- weighted sample = painotettu otos
- white noise = valkoinen kohina
- Wiener process = Wienerin prosessi
- winsorization = winsorointi