Näillä termeillä on kieliteknologian sovelluksissa ja erityisesti tekstinkäsittelyohjelmissa hiukan yleiskielestä poikkeava merkitys. Voikon kehittäjät tapaavat käyttävät näitä sanoja teknisinä termeinä, joten selvennetäänpä niitä hiukan:
On selvää, että ainakin lähitulevaisuudessa suurin osa Voikon käyttäjistä on aikaisemmin käyttänyt joko Microsoft Wordia tai Soikkoa OpenOffice.orgissa. Soikko ja Wordin oikoluku ovat melko pitkälti samankaltaisia, joten Voikon käyttöön siirtyvät voivat toivoa senkin jatkavan samankaltaista linjaa. Toivomus on oikeutettu, ja erityisesti openoffice.org-voikon kehityksessä yhteensopivuus pyritään järkevissä määrin säilyttämään.
Kuitenkin haluamme kehittää Voikkoon myös ominaisuuksia, joita muissa vastaavissa ohjelmissa ei ole. Koska Voikon kehittäjien joukko on suhteellisen pieni, meillä ei yleensä ole valintatilanteissa varaa kehittää kahta täysin erilaista ratkaisua, vaan joudumme tekemään kompromisseja. Seuraavassa muutamia asioita, joihin Voikkoon siirtyvä saattaa kiinnittää huomioita:
Sitä, onko Voikon oikoluku nykyisessä muodossaan (toukokuussa 2007) kokonaisuutena parempi vai huonompi kuin Wordin kielityökalut tai Soikko, on vaikea objektiivisesti arvioida. Uudet Wordin versiot sisältävät jo kieliopin tarkistuksen, joten on kaiketi turvallista sanoa, että tälle tasolle Voikko ei vielä ole yltänyt. Mutta vertailu vanhoihin Wordin versoihin sekä Soikkoon on jo hankalampaa. Eri käyttäjät painottavat eri piirteiden tärkeyttä, ja kirjoitettavalla tekstilajillakin on merkitystä. Ainakin Soikon ja Voikon välisessä vertailussa mielipiteet näyttävät jakautuvan. Tavutuksen laadun osalta Voikko on jotakuinkin samalla tasolla Wordin kanssa ja merkittävästi Soikkoa parempi.
Kaikkien aikaisempien hyvälaatuisten suomen kielen oikolukuohjelmien käyttöä rajoittavat monet seikat. Yleensä oikolukuohjelma hankitaan jonkin muun ohjelman (esimerkiksi tekstinkäsittelyohjelman) mukana, eikä sitä ole mahdollista käyttää kyseisen ohjelman ulkopuolella. On myös olemassa Soikko-niminen oikolukuohjelma, jonka käyttöä ei periaatteessa ole rajoitettu mihinkään yksittäiseen sovellukseen, ja sitä saa myös kuka tahansa käyttää tai levittää ilmaiseksi. Soikkoonkin liittyy silti oleellinen rajoitus: sitä ei voi muokata. Siispä sen sanastoa ei voi päivittää (eikä sitä ole kukaan päivittänytkään muutamaan vuoteen) ja sitä voi käyttää ainoastaan tietyissä käyttöjärjestelmissä ja tietyn tyyppisissä tietokoneissa. Vapaiden ohjelmistojen kehittäjille Soikon lisenssi aiheuttaa lisäksi muitakin ongelmia, jotka vähintäänkin vaikeuttavat sen käyttöä, usein jopa estävät sen.
On myös olemassa oikolukuohjelmia, joissa näitä ongelmia ei esiinny ollenkaan, tai ongelmat on mahdollista tarvittaessa korjata. Näitä vapaita oikolukuohjelmia ovat (vanhimmasta uusimpaan) Ispell, Aspell, Myspell ja Hunspell. Valitettavasti yhdellekään näistä ohjelmista ei ole olemassa laadukasta suomen kielen sanastoa. Myös niiden heikko kyky käsitellä suomen mutkikkaita sananmuodostussääntöjä on ollut ongelma, vaikkakin Hunspell on tässä asiassa merkittävästi parempi kuin muut mainitut sovellukset.
GPL (GNU General Public License) on ohjelmistolisenssi, jonka alaisuudessa Voikkoa levitetään. Sen avulla ohjelmien, ja tässä projektissa myös sanastojen, kirjoittajat eli tekijänoikeuden haltijat antavat kenelle tahansa luvan käyttää ja tietyin ehdoin myös jakaa muille tekijänoikeuslain suojaamaa materiaalia. Ainakin ohjelmien ja sanaston kehittämiseen osallistuvien olisi syytä ymmärtää GPL:stä vähintään perusteet. GPL:stä on olemassa epävirallinen suomennos.
Kaikki Voikon osat ovat käytettävissä GPL:n version 3 (sekä mahdollisten myöhemmin julkaistavien) ehdoilla. Tämän lisäksi osa projektin tuottamasta materiaalista on saatavilla muillakin lisensseillä, mutta näillä ei kuitenkaan ole suurta merkitystä Voikon käyttäjille.
Voikkoa kehittää joukko yksityisiä asiasta kiinnostuneita ihmisiä. Tällä hetkellä (toukokuussa 2007) aktiivikehittäjiä ovat mm. Teemu Likonen, Harri Pitkänen ja Hannu Väisänen, mutta monet muutkin osallistuvat työhön säännöllisesti esimerkiksi huolehtimalla Voikon integroinnista Linux-jakeluihin. Voikko ei ole akateeminen projekti, eikä sen taustalla ole yritys- tai yhdistystoimintaa. Tämä ei kuitenkaan tarkoita sitä, etteivätkö yritykset tai yliopistot voisi osallistua Voikon kehitykseen tai käyttää projektin tuottamia ohjelmia ja muita resursseja, kunhan pelisääntöjä (siis ohjelmien ja sanastotietokantojen lisenssejä) noudatetaan.
Voikko on pääasiassa vapaaehtoisvoimin toimiva projekti, joten kaikki apu on lämpimästi tervetullutta. Tässä hiukan vinkkejä alkuun pääsemiseksi.
Ensimmäisenä kannattaa tutustua Voikon käyttöön. Jos mahdollista, yritä asentaa Voikko omalle tietokoneellesi. Kun olet asentanut libvoikon ja Suomi-malagan, voit käyttää komentorivillä toimivia testiohjelmia voikkospell ja voikkohyphenate. Testiohjelmien lisäksi voit asentaa mm. openoffice.org-voikon, jonka avulla voit käyttää Voikkoa OpenOffice.org-ohjelmistossa. Mikäli Voikon asentaminen ei onnistu, kokeile webvoikkoa.
Helpoin tapa auttaa on käyttää Voikkoa ja kertoa havaitsemistaan puutteista. Jos vaikkapa oikolukuohjelma ei tunnista oikein kirjoitettua sanaa, käytä sanastonkeruusovellusta asiasta ilmoittamiseen. Muista ongelmista voi kirjoittaa vaikkapa projektin postituslistalle.
Voikko-projektissa eniten työaikaa menee sanaston, yhdyssana- ja tavutussääntöjen, tavutuksen sekä jatkossa ehkä myös kielioppisääntöjen kehittämiseen. Siispä projektiin osallistuvien ei tarvitse olla "tietokonenörttejä", vaan pelkällä vahvalla suomen kielen taidolla pärjää hyvin. Tärkeimmät sanaston kehityksessä käytettävät työkalut toimivat www-selaimen kautta, joten työhön pääsee helposti käsiksi ja sitä voi tehdä omien aikataulujensa mukaan. Mitään työmäärävaatimuksia ei vapaaehtoisille aseteta, mutta vastuullista ja haastavaakin työtä on tarjolla niille, jotka sellaista haluavat.
Teknisesti suuntautuneet voivat auttaa mm. testaamalla ohjelmaa tai osallistumalla ohjelmointiin.
Jos jokin yllä mainituista tavoista osallistua projektiin kiinnostaa, tutustu rauhassa sivuihimme ja ota sitten yhteyttä joko postituslistan tai palauteosoitteemme kautta. Projektin organisaatiosta (tai pikemminkin sen puutteesta) johtuen emme voi maksaa työstä korvausta, kirjoittaa työtodistuksia tai toimia oppilaitosten harjoitus- tai opinnäytetöiden ohjaajina. Osallistujat voivat kuitenkin omatoimisesti pyrkiä hankkimaan työlleen rahoitusta tai selvittää, voiko esimerkiksi tutkintoon kuuluvia harjoitustöitä tehdä Voikkoon liittyvästä aiheesta. Molempia on vuoden 2006 aikana tehty, joten ota rohkeasti meihin yhteyttä jos haluat projektin kehittäjien arvioivan projektiehdotelmasi soveltuvuutta Voikon osaksi. Kaikki Voikko-projektiin hyväksytty työ tulee julkisesti saataville. Siispä esimerkiksi työnantajat voivat tarkistaa osallistumisesi projektiin ilman erillisiä todistuksiakin.
Tämä kysymys tulee usein esille silloin, kun OpenOffice.orgista on julkaistu uusi versio, ja kysyjä on "päivittänyt" jakelunsa mukana tulevan OpenOffice.orgin asentamalla tämän uuden version sen tilalle. Valitettavasti OpenOffice.org ei mahdollista lisäosien (openoffice.org-voikko) ja ulkopuolisten komponenttien (libvoikko) välisien riippuvuuksien määrittelyä. Nämä määrittelyt voidaan tehdä ainoastaan Linux-jakelun oman pakettienhallintajärjestelmän kautta, ja tästä syystä Voikkoa ei voi käyttää muun kuin jakelun virallisista lähteistä asennetun OpenOffice.orgin kanssa. Tässä suhteessa Voikko poikkeaa oleellisesti aikaisemmin käytössä olleesta suljetun lähdekoodin Soikko-oikoluvusta: Voikko on käyttöjärjestelmän mukana tuleva oikolukukomponentti, Soikko asennettiin aina erikseen kutakin sovellusta varten.
Kannattaa myös muistaa, että Linux-jakeluiden mukana tulevat OpenOffice.org-ohjelmistot usein sisältävät ominaisuuksia, joita alkuperäiset versiot eivät sisällä. Jakelun ulkopuolisen version asentaminen ei siis aina ole askel parempaan suuntaan, vaikka versionumeron perusteella siltä näyttäisikin.
Yleisesti ottaen et voi. Tähän on kuitenkin joitakin poikkeuksia. Omaan käyttöön saat tarvittavat muutokset tehdä, mikäli kyseisen ohjelmiston lisenssi sen sallii. Jos olet ohjelmiston kehittäjä, voit lisätä ohjelmistoosi tuen vaikkapa ispell-oikoluvulle ja toivoa, että käyttäjillä on tmispell-voikko asennettuna. Muitakin poikkeuksia voi olla, mutta niihin ei välttämättä kannata turvautua ilman pätevän lakimiehen apua, jos sittenkään. Voit toki kysyä Voikon kehittäjien kantaa ehtojen soveltamisesta omaan tilanteeseesi. Meitä on kuitenkin niin monta, että selvästi GPL:stä poikkeavia ehtoja ei käytännössä ole mahdollista luvata edes poikkeustapauksissa.
Jos levität ohjelmistoasi vapaalla (avoimen lähdekoodin) lisenssillä, kannattaa ongelmien välttämiseksi valita GPL-yhteensopiva lisenssi aina kun se vain on mahdollista. Suosituimpien vapaiden lisenssien joukosta löytyy moneen eri tarkoitukseen sopivia GPL-yhteensopivia vaihtoehtoja, ja kaksoislisensointi on myös mahdollista.
Voit. Levitystavasta riippuen lisäsanastojen lisenssin täytyy kuitenkin olla GPL-yhteensopiva. Teknisistä syistä johtuen lisäsanastoja ei voi helposti levittää muuten kuin lähdekoodimuodossa. GPL-yhteensopivuus edellyttää lisäksi sitä, että et voi estää asiakkaitasi levittämästä sanastojaan muille. Siksi niiden tuotteistaminen ja myyminen useammalle kuin yhdelle asiakkaalle sellaisenaan tuskin on kannattava liiketoimintamalli. Silti esimerkiksi tilaustyönä yrityksille räätälöityjen sanastojen tekeminen voi toimia, ja on täysin sallittua Voikon lisenssin puitteissa.
Monet erityisesti Gnome-työpöytäympäristön ohjelmat käyttävät suoraan aspellia oikolukutoiminnon toteuttamiseen. Onkin usein toivottu, että Voikolle tehtäisiin aspell-emulaatiokomponentti, samaan tapaan kuin tmispell-voikko tarjoaa ispell-emulaatiota. Tätä ei voida helposti tehdä, koska sovellukset käyttävät aspellia ja myspelliä jaetun kirjaston kautta (ispell on erillinen ohjelma). Jaettujen kirjastojen rajapintojen täysin yhteensopiva kopioiminen on hyvin hankalaa, ja pienikin virhe voi rikkoa kirjastoa käyttävän sovelluksen muutenkin kuin oikoluvun osalta. Vanhat versiot Hunspellistä eivät edes tarjoa dynaamista jaettua kirjastoa, vaan ainoastaan staattisen version.
Voikko-projektin puitteissa ei ole siis aikomusta kehittää uusia emulaatiokomponentteja. Työn alla oleva Desktop Language Checking Specification on suunniteltu ratkaisemaan juuri tämä ongelma, eikä ole tarpeen mutkistaa tilannetta kilpailevia (ja teknisesti kestämättömiä) ratkaisuja kehittämällä. Viime aikoina Gnome-ohjelmat ovat alkaneet siirtyä tämän spesifikaation pohjana olevan Enchant-kirjaston käyttäjiksi. Koska Voikko toimii Enchantin kautta, Gnomen versiossa 2.18 jo esimerkiksi Gedit pystyy käyttämään Voikkoa oikoluvussa.
Voit lähettää sähköpostitse kysymyksiä projektin postituslistalle tai henkilökohtaisesti projektin ylläpitäjälle yhteystietosivullamme mainituilla tavoilla.