Back to Index
Voikko
Release notes
Here you will find the release notes for different components of Voikko.
These notes only mention notable changes between releases. Full changelogs
for libvoikko, tmispell-voikko, openoffice.org-voikko and mozvoikko are available in
the source packages, and for Suomi-malaga in the Subversion revision history.
The releases are listed in reverse chronological order.
Mozvoikko 0.9.5 (2008-06-18)
Initial release. This version requires libvoikko 1.7 or later. Older
versions of libvoikko can also be used, but quality of spell checking
will be reduced.
Libvoikko 1.7 (2008-05-24)
This version requires malaga 7.8 or later and Suomi-malaga 0.7.3 or later
(1.0 or later is recommended for optimal performance). After version 1.6
some bug fixes and the following new features have been added:
- New option VOIKKO_OPT_ACCEPT_EXTRA_HYPHENS to accept hyphens in some
places where they would normally not be allowed. The exact behaviour of
this option is not specified and may change in future releases.
- New option VOIKKO_OPT_ACCEPT_MISSING_HYPHENS to accept a word even if
a required hyphen is missing at the start or end of the word. This is useful
for applications that tokenise text using (mainly English) convention of treating
hyphens as non-word characters.
- Search space for spelling suggestions has been extended by 40 %.
Suomi-malaga 1.1 (2008-04-28)
This version requires malaga 7.8 or later. For use with Voikko, libvoikko
1.2 or later is needed. Changes after version 1.0 consist mainly of new
words added to the vocabulary and various changes to Sukija.
Openoffice.org-voikko 2.2 (2008-02-17)
This version requires libvoikko 1.5 or later, and OpenOffice.org 2.0.4
or later. After version 2.1 support for OS X 10.5 has been added and
compatibility with Windows, Fedora and OpenOffice.org 2.4 has been improved.
Tmispell-voikko 0.7 (2008-02-17)
This version requires libvoikko 1.0 or later, and Enchant 1.1.6 – 1.3
for Enchant support. After version 0.6.3 the following changes have been
made:
- In order to conform to typical Linux distribution packaging guidelines,
glibmm sources have been removed from the source package
and replaced with dependency on system glibmm.
- Dependency on ncurses has been replaced with dependency on ncursesw.
This substantially improves the curses based user interface in UTF-8 locales.
Please note that source code for Enchant 1.4 (released on 2008-03-31) and
later contains updated provider plugin for Voikko. If you have such
version, you must use configure option --disable-enchant when building
tmispell-voikko. The version of Enchant provider plugin shipped with
tmispell-voikko is deprecated and provided only for compatibility with earlier
versions of Enchant.
Suomi-malaga 1.0 (2008-01-10)
This version requires malaga 7.8 or later. For use with Voikko, libvoikko
1.2 or later is needed. After version 0.7.7 the following changes have been
made:
- The Voikko specific branch 0.7.x has been discontinued. This combined version
supports both Voikko and Sukija (although Sukija is not yet usable in this release),
and contains the latest vocabulary and morphology for both applications.
- New build option MIN_FREQUENCY to control vocabulary size for Voikko.
- Some small fixes and improvements.
Suomi-malaga 0.7.7 (2007-12-04)
This version requires malaga 7.8 or later and libvoikko 1.2 or later. After
version 0.7.6 the following new features and bug fixes have been added:
- New words have been added
- Common types of numerals are accepted even when written as numbers
- Disk space and memory use have been reduced by over 10 %
- Better analysis speed for correct words
- Many bugs have been fixed.
Libvoikko 1.6 (2007-12-04)
This version requires malaga 7.8 or later and Suomi-malaga 0.7.3 or later. After
version 1.5 the following new features and bug fixes have been added:
- Spelling suggestions for numerals in Suomi-malaga 0.7.7
- Most email addresses and some URLs are filtered out by default
during spell checking
- Ability to use environment variable VOIKKO_DICTIONARY_PATH to specify the
dictionary path
- String tokenizer functions have been added. These can be used
to find word boundaries from running text for spell checking and hyphenation.
Tmispell-voikko 0.6.3 (2007-11-17)
This version requires libvoikko 1.0 or later, and Enchant 1.1.6 or later
for Enchant support. This release contains build fixes for upcoming GCC 4.3
and some minor cleanups.
Suomi-malaga 0.7.6 (2007-08-31)
This version requires malaga 7.8 or later and libvoikko 1.2 or later. After
version 0.7.5 the following new features and bug fixes have been added:
- Stricter compounding rules for verbs and nouns derived from verbs
- Unnecessary prefixes have been removed
- New words have been added
- Better analysis speed for correct and incorrect words
- Many bugs have been fixed.
Openoffice.org-voikko 2.1 (2007-08-25)
This version requires libvoikko 1.5 or later, and OpenOffice.org 2.0.4
or later. After version 2.0.1 the following notable changes have been made:
- Support for Windows has been added
- Support for building a standalone extension (including showing the
license during extension installation) has been added.
Libvoikko 1.5 (2007-08-20)
This version requires malaga 7.8 or later and Suomi-malaga 0.7.3 or later. After
version 1.4.1 the following new features and bug fixes have been added:
- Porting fixes, especially for Windows
- Improvements in spelling suggestions and voikkospell.
Tmispell-voikko 0.6.2 (2007-05-23)
This version requires libvoikko 1.0 or later, and Enchant 1.1.6 or later
for Enchant support. Changes after version 0.6.1 include, among other things,
improvements to the Enchant plugin taken from Enchant CVS. These changes
allow the use of Enchant plugin with some applications that have recently
been ported to use Enchant for spell checking (most notably Gedit).
Suomi-malaga 0.7.5 (2007-05-15)
This version requires malaga 7.8 or later and libvoikko 1.2 or later. After
version 0.7.4 the following new features and bug fixes have been added:
- Some incorrect words, and many words that were considered unsuitable for
written language have been removed
- Some words have been moved to different inflection classes to
match modern written Finnish
- New words have been added
- Better analysis speed for correct and incorrect words
- Smaller size of the binary lexicon file
- Many bugs have been fixed
- Build system has been rewritten. Application independent XML format
is now used for original word lists.
Openoffice.org-voikko 2.0.1 (2007-05-15)
This release fixes some bugs found in version 2.0. For compatibility
requirements, see the release notes for version 2.0.
Libvoikko 1.4.1 (2007-05-15)
This release contains small improvements to hyphenation rules. For compatibility
requirements, see the release notes for version 1.4.
Openoffice.org-voikko 2.0 (2007-04-30)
This version requires libvoikko 1.0 or later, and OpenOffice.org 2.0.4
or later. After version 1.2 the code has been mostly rewritten.
The following notable changes have been made:
- Hyphenation settings of OpenOffice.org are now respected. Each paragraph
may use different settings.
- Extension is now packed using the new .oxt format.
- The license has been switched to the GPL.
Libvoikko 1.4 (2007-04-30)
This version requires malaga 7.8 or later and Suomi-malaga 0.7.3 or later. After
version 1.3.1 the following new features and bug fixes have been added:
- New command line options for voikkospell
- Better spelling suggestions for OCR applications
- Improved hyphenation of words with certain special characters
- Fixed option VOIKKO_INTERSECT_COMPOUND_LEVEL.
Suomi-malaga 0.7.4 (2007-02-15)
This version requires malaga 7.8 or later and libvoikko 1.2, 1.3 or 1.4. After
version 0.7.3 the following new features and bug fixes have been added:
- Some incorrect words, and many words that were considered unsuitable for
written language have been removed
- Adverbs are no longer generally allowed in compound words
- Compound numerals are now accepted, but compounding numerals with other
nouns is no longer freely allowed
- New words have been added
- Correct words are analysed faster than in the previous version
- Many bugs have been fixed.
Libvoikko 1.3.1 (2007-02-12)
This release fixes a regression in version 1.3 related to spelling suggestions
for words starting with capital letter. For compatibility requirements, see the release
notes for version 1.3.
Libvoikko 1.3 (2007-02-05)
This version requires malaga 7.8 or later and Suomi-malaga 0.7.3 or 0.7.4. After
version 1.2 the following new features and bug fixes have been added:
- Full support for Windows, including the use of registry keys to specify the default
location for Suomi-malaga project files
- Slightly improved spelling suggestions, including a new optional mode for use with
OCR applications
- Certain uses of disambiguating or optional hyphens are no longer rejected in spell
checking
- Hyphenator now detects more syllable breaks when VOIKKO_OPT_NO_UGLY_HYPHENATION=0
- New hyphenator option VOIKKO_MIN_HYPHENATED_WORD_LENGTH to limit the length of the
words to be hyphenated, including the length of the components of a compound word
- Fixes for character case check and hyphenation for words containing punctuation.
In 2006 we made simultaneous releases of all the components of Voikko. The
Finnish release notes from that period are available below.
Versio 1.2
Versio 1.2 julkaistiin 15.11.2006, ja se koostuu seuraavista komponenteista:
- libvoikko 1.2
- Suomi-malaga 0.7.3 (”Voikko edition”)
- openoffice.org-voikko 1.2
- tmispell-voikko 0.6.1.
Tämä versio vaatii toimiakseen malagan version 7.8 tai uudemman.
Käyttäjän kannalta merkittävät muutokset
- Vierasperäisten sanojen, yhdyssanojen ja tiettyjen poikkeavasti tavuttuvien sanojen tavutusta
on parannettu.
- Isojen kirjainten käyttöä on tarkennettu ja korjailtu.
- Tunnistettavaa nimistöä on laajennettu: lähes kaikki Suomen kunnat sekä monet aikaisemmin
tunnistamatta jääneet yleiset etu- ja sukunimet tunnistuvat oikein.
- Etuliitteiden ja lyhyiden nominien käyttöä yhdyssanoissa on rajoitettu, minkä johdosta
vääriä korjausehdotuksia annetaan vähemmän ja väärin kirjoitettujen sanojen havaitseminen
helpottuu.
- Joitakin virheellisiä ja murteellisia taivutusmuotoja ei enää hyväksytä.
- Sanastoon on lisätty sanoja ja virheellisiä sanoja on poistettu.
- Tmispell-voikko toimii KDE:ssa myös käyttäjillä, joiden oletusmerkistö on jokin muu kuin
UTF-8.
- Libvoikko tarkistaa käytettävän Suomi-malagan version ja kieltäytyy käyttämästä
epäyhteensopivaa versiota.
- Oo2-voikon nimi on vaihdettu openoffice.org-voikoksi vastaamaan Linux-jakeluiden
yleistä käytäntöä.
Ohjelmistonkehittäjien ja tehokäyttäjien kannalta merkittävät muutokset
- Libvoikko sallii sovelluskohtaisen sanastohakemiston määrittämisen alustusfunktion
voikko_init_with_path avulla.
- Suomi-malagassa on alustava tuki hyväksyttävien taivutusmuotojen hienosäädölle ja
omien lisäsanastojen käytölle.
Versio 1.1
Versio 1.1 julkaistiin 14.9.2006, ja se koostuu seuraavista komponenteista:
- libvoikko 1.1
- Suomi-malaga 0.7.2 (”Voikko edition”)
- Oo2-voikko 1.1
- tmispell-voikko 0.6.
Tämä versio vaatii toimiakseen malagan version 7.4 tai uudemman.
Käyttäjän kannalta merkittävät muutokset
- Versiossa 1.0 monikäsitteisistä yhdyssanoista (esimerkiksi ”kaivosaukko”) pystyi rakentamaan merkkijonoja,
joiden oikoluku ja tavutus vei niin paljon prosessoriaikaa, että libvoikkoa käyttävät ohjelmat käytännöllisesti
katsoen jumiutuivat. Tämä on korjattu laskemalla käsiteltävien sanojen pituusrajaa 255 merkistä 59 merkkiin.
Samantapaisia ongelmia esiintyy myös muissa oikolukuohjelmissa. Olemme testanneet seuraavat ohjelmat:
- Soikko
-
Soikon jaettu kirjasto kärsii tästä samasta ongelmasta: siinä ei sanojen pituudelle ole nähtävästi mitään ylärajaa.
Ongelma on korjattu ainakin Oo2-soikon versiossa 1.1.2, jossa ylärajaksi on asetettu 74 merkkiä. Jos käytät muuta
Soikon sisältävää oikolukuohjelmaa tai -komponenttia kuin Oo2-soikkoa, kysy ohjelman tekijältä, koskeeko ongelma myös
kyseistä ohjelmaa.
- hunspell
-
Hunspellin jaetussa kirjastossa sanojen pituus on rajoitettu noin 100 merkkiin. Siispä kirjastoa käyttävät ohjelmat
eivät automaattisesti kärsi tästä ongelmasta, mutta Hunspellin komentorivityökalu (versio 1.1.4) kaatuu, jos
siihen syötetään yli 100 merkkiä pitkiä merkkijonoja.
- ispell ja myspell
-
Näissä on noin 100 merkin yläraja käsiteltävien sanojen pituudelle, eikä niissä näytä olevan tätä ongelmaa.
- Microsoft Word
-
Wordin suomen kielen oikoluku näyttäisi rajoittavan oikoluettavien sanojen pituuden noin 60 merkkiin. Tätä pidemmät
sanat hyväksytään aina oikeiksi. Word ei siis kärsi tästä ongelmasta.
- OpenOffice.orgissa oikolukudialogin kautta tehtävä oikoluku on korjattu.
- Väärin kirjoitettujen sanojen korjausehdotuksia on korjattu.
- Lisätty tuki erinäisille vaihtoehtoisille Unicode-merkeille ja merkkiyhdistelmille oikoluvussa.
- Pieni määrä virheellisesti hyväksyttyjä taivutuksia on korjattu.
- Lisätty tuki tyyppiä mAinen (”koiramainen”) ja lAinen (”jyväskyläläinen”) oleville johdoksille.
- Tmispell-voikon interaktiivinen käyttöliittymä on saatavissa suomenkielisenä.
Ohjelmistonkehittäjien kannalta merkittävät muutokset
- Oo2-voikko ja tmispell-voikko eivät enää käytä ohjelmakirjastojen avaamiseen dlopen/dlsym -kutsuja vaan
normaalia käännösaikaista dynaamista linkitystä.
Versio 1.0
Voikon ensimmäinen vakaa versio 1.0 julkaistiin 13.8.2006, ja se koostuu seuraavista komponenteista:
- libvoikko 1.0
- Suomi-malaga 0.7.1 (”Voikko edition”)
- Oo2-voikko 1.0
- tmispell-voikko 0.5.0.
Tämä versio vaatii toimiakseen malagan version 7.4 tai uudemman.
Hosted by
Last update: $Id: releases.html 2199 2008-06-18 16:44:23Z hatp $