Haku

KATIHA-tilastosovellus : Väestötieteellisen tietokanta-aineiston tilastolliset vaatimukset

QR-koodi

KATIHA-tilastosovellus : Väestötieteellisen tietokanta-aineiston tilastolliset vaatimukset

Opinnäytetyö tehtiin Karjala-tietokannan tilastosovelluksen ohjelmoinnin ja testauksen tueksi. Tilastosovelluksen laatimisen taustalla oli tarve tarjota luovutetun alueen väestötietoja tieteellisen tutkimuksen lähdeaineistoksi. Karjala-tietokantaan jo tallennetut 9 miljoonaa henkilömerkintää vuosilta 1680−1950 antoivat perustellun lähtökohdan tilastollisten laskelmien toteuttamiselle.

KATIHA-tilastosovelluksen suunnitteluvaiheessa todettiin, että tietokanta-aineisto sisältää rippi- ja lastenkirjojen lisäksi 70 seurakunnan syntyneiden, kuolleiden, vihittyjen ja muuttaneiden luettelot. Samalla tiedostettiin, että kirkollisten luetteloiden tiedoista voidaan demografisia tutkimusmenetelmiä käyttäen tutkia sekä väestön määrää ja rakennetta että väestön muutoksia. Tiedon käsittelyssä tutkijoiden valittavana havaittiin olevan kolme tilastollista menetelmää: tilastollinen tiivistäminen, päättely ja mallintaminen.

Opinnäytetyössä sovellettiin tilastolliseen päättelyyn sisältyvää hypoteesin menetelmän loogisen rekonstruktion mallia tietokanta-aineiston kuolinsyiden luokittelussa. Historiallisten kuolinsyiden luokittelun apuna käytettiin mm. digitoituja sanakirjoja vuosilta 1801 ja 1859. Manuaalisen 120 tuntia kestäneen kuolinsyiden koodaamisen lisäksi toteutettiin ohjelmallinen luokitus sekä ammattien että kuolinsyiden osalta. Ammattinimikkeitä oli jo aiemmin luokiteltu kansainvälisen HISCO-luokituksen mukaisesti. Kuolinsyiden luokituksen perustaksi oli 10 vuotta sitten valittu kuolemansyynimistö vuodelta 1935. Luokituksissa käytetyistä koodistoista dokumentoitiin metatiedot JHS Koodistot ja luokitukset –suositusluonnoksen mukaisesti. Lisäksi luokituksille ja koodistoille määriteltiin laatuvaatimukset.

Lopuksi todettiin, että tilastosovelluksen tietokanta-aineiston luokittelua täytyy vielä täydentää ja kehittää esim. hierarkkisten koodistojen suuntaan. Ammattien osalta mallia voisi ottaa EU:n tilastoviranomaisten ohjeistuksen mukaan laaditusta JHS 150 Ammattiluokitus –suosituksesta. Kuolinsyiden koodistoa voitaisiin puolestaan kehittää WHO:n julkaiseman ICD-10 –tautinimistön ryhmittelyn pohjalta.

Tallennettuna: