Contents - Index - Previous - Next
Media - American Soundex System
Kääntänyt Esa Lahtomaa 2016/2017/2018
Tarkistamaton versio!
American Soundex System koodi sisältää nimen ensimmäisen kirjaimen jälkeen kolmesta kirjaimesta. Nämä kolme kirjainta on määritetty pudottamalla kirjaimet a, e, i, o, u, h, w ja y ja lisäämällä kolme kirjainta jäljelle jääneistä nimen kirjaimista alapuolella olevan taulukon mukaisesti. Käytössä on vain kaksi vaihtoehtoista sääntöä. (1) Mikäli kahdella tai useammalla peräkkäisellä kirjaimella on samat koodit, niin ne koodataan yhdeksi kirjaimeksi. (2) Mikäli ei löydy riittävää määrää kirjaimia tehdäksesi kolme kirjainta, jäljelle jääneet kirjaimet asetetaan arvoon nolla.
Soundex Taulukko
1 b, f, p, v
2 c, g, j, k, q, s, x, z
3 d, t
4 l
5 m, n
6 r
Esimerkit:
Miller M460
Peterson P362
Peters P362
Auerbach A612
Uhrbach U612
Moskowitz M232
Moskovitz M213
Ashcroft A261
Burroughs B620
Soundex koodin laskeminen käsin:
1. Tulosta nimi paperille.
2. Yliviivaa välilyönnit, välimerkit, aksentit ja muut merkit.
3. Yliviivaa, mikä tahansa seuraavista merkeistä A, E, I, O, U, H, W, Y (ellei ole sukunimen ensimmäinen kirjain).
4. Yliviivaa toinen kirjain kaksoiskappalemerkeistä.
5. Yliviivaa toinen vierekkäisistä kirjaimista, jolla on sama soundex numero.
6. Muunna merkit positioista 2 - 4 numeroiksi.
B, P, F, V = 1
C, S, K, G, J, Q, X, Z = 2
D, T = 3
L = 4
M, N = 5
R = 6
7. Täytä käyttämättömät positiot nollilla esimerkiksi Lee on L000, Bailey on B400. Yhtä kirjainta seuraa aina kolme numeroa.
Soundex rajoitukset
Nimet, jotka kuulostavat samanlaisilta eivät aina omaa samaa soundex koodia. Esimerkiksi, Lee (L000) ja Leigh (L200) äännetään identtisesti, mutta niillä on erilainen soundex koodi, koska "hiljainen g" sanassa Leigh sisältää koodin.
Nimet, jotka kuulostavat samanlaisilta, mutta alkavat erilaisella ensimmäisellä kirjaimella omaavat aina erilaisen soundex koodin. Täten, nimet kuten Carr (C600) ja Karr (K600) pitäisi laskea erikseen.
Soundex perustuu englantilaiseen ääntämiseen, joten Euroopan nimet eivät koodaannu oikein. Esimerkiksi, jotkut ranskalaiset sukunimet "hiljaisella" viimeisellä kirjaimella eivät koodaannu ääntämisen mukaan. Tämä todentuu ranskalaisessa nimessä kuten Beaux - missä x on "hiljainen". Joskus tämä sukunimi kirjoitetaan myös Beau (B000) ja äännetään identtisesti Beaux (B200), kuitenkin niillä on erilaiset soundex koodit. Vaikka esimerkkinä on vain Ranska, niin tämä voi todentua kaikissa nimissä, jotka eivät käytä englantilaista ääntämystä.
Joskus nimet, jotka eivät kuulosta samanlaisilta, omaavat samat soundex koodit. Kun etsit sukunimeä Powers (P620), joudut käymään lävitse sukunimien Pierce, Price, Perez ja Park, joilla kaikilla on sama soundex koodi. Kuitenkin Power (P600), yleisempi tapa kirjoittaa on Powers 100 vuotta sitten ja tällä on erilainen soundex koodi.
Sukunimet, joissa on etuliite, olivat yleensä ilman etuliitettä, mutta ei aina. Mikäli olet etsimässä sukunimeä kuten DiCaprio tai LaBianca, sinun pitäisi yrittää soundex hakua etuliitteellä ja ilman etuliitettä.
US väestörekisterin soundex sekavuus nousee esiin nimissä kuten Ashcraft. Kun alkuperäinen soundex koodari ei koodannut H-kirjainta ja eikä ottanut huomioon H-kirjainta erottimena vierekkäisten kirjainten välillä, joilla oli samat koodit S ja C, joten S ja C pidetään vierekkäisinä kirjaimina ja koodataan vain kerran, joten soundex on täten A261. Vuonna 1920 NY väestörekisteristä, Ashcraft löytyy koodilla A261, minkä tuloksen saat tämän sivun laskimella.
Ne, jotka koodasivat soundex 1880*, 1900 ja 1910** väestörekisteritiedot ovat mahdollisesti voineet käyttää tai olla käyttämättä tämä sääntöä. Välillä he tulkitsivat H-kirjaimen erottimena ja eivät koodanneet S ja C -kirjaimia peräkkäisinä kirjaimina, jotka olisivat olleet vain yksi kirjain, vaan antoivat numerokoodin jokaiselle kirjaimelle. Tällöin Ashcraft olisi A226.
On erittäin tärkeää tietää, ettei US väestörekisterin nimiä muodostettu käyttämällä H-kirjainta ja W-kirjainta erottimena vierekkäisten kirjainten välillä. Mikäli olet yrittänyt laskea soundex nimeä kirjaimilla W tai H, jotka erottavat kaksi vierekkäistä kirjainta, niin paras tapa on laskea soundex käyttämällä kahta erilaista menetelmää paikallistamaan nimi US väestörekisteristä. Tämä pitää paikkansa kaikissa nimissä, joissa on joku seuraavista kirjaimista C,S,G,J,K,Q,X,Z molemmin puolin kirjaimia H tai W kuten SHC, sHS, CHS, kHZ, SWS, kWS, CWK.
Sukunimi, jossa on enemmän kuin yksi sana tai sukunimi, joka normaalisti tulee ennen etunimeä, kuten Native Americans ja Chinese sukunimet, voivat olla koodattuja nimenä, mikä ilmestyy viimeisimpänä, vaikka se ei olisikaan oikea sukunimi. Moniosaisista sukunimistä, vain viimeinen osa on koodattu.
9-0169 / E Lahtomaa