Contents - Index - Previous - Next


Media - American Soundex System

 

Kääntänyt Esa Lahtomaa 2016/2017/2018

Tarkistamaton versio!

 

American Soundex System koodi sisältää nimen ensimmäisen kirjaimen jälkeen kolmesta kirjaimesta. Nämä kolme kirjainta on määritetty pudottamalla kirjaimet a, e, i, o, u, h, w ja y ja lisäämällä kolme kirjainta jäljelle jääneistä nimen kirjaimista alapuolella olevan taulukon mukaisesti. Käytössä on vain kaksi vaihtoehtoista sääntöä. (1) Mikäli kahdella tai useammalla peräkkäisellä kirjaimella on samat koodit, niin ne koodataan yhdeksi kirjaimeksi. (2) Mikäli ei löydy riittävää määrää kirjaimia tehdäksesi kolme kirjainta, jäljelle jääneet kirjaimet asetetaan arvoon nolla.

 

Soundex Taulukko

 1   b, f, p, v  

 2   c, g, j, k, q, s, x, z  

 3   d, t  

 4   l  

 5   m, n  

 6   r  

 

 

Esimerkit:

 Miller M460  

 Peterson P362  

 Peters P362  

 Auerbach A612  

 Uhrbach U612  

 Moskowitz M232  

 Moskovitz M213  

 Ashcroft A261  

 Burroughs B620  

 

Soundex koodin laskeminen käsin: 

1. Tulosta nimi paperille.

2. Yliviivaa välilyönnit, välimerkit, aksentit ja muut merkit. 

3. Yliviivaa, mikä tahansa seuraavista merkeistä A, E, I, O, U, H, W, Y (ellei ole sukunimen ensimmäinen kirjain).

4. Yliviivaa toinen kirjain kaksoiskappalemerkeistä. 

5. Yliviivaa toinen vierekkäisistä kirjaimista, jolla on sama soundex numero. 

6. Muunna merkit positioista 2 - 4 numeroiksi. 

B, P, F, V = 1 

C, S, K, G, J, Q, X, Z = 2 

D, T = 3 

L = 4 

M, N = 5 

R = 6 

 

7. Täytä käyttämättömät positiot nollilla esimerkiksi Lee on L000, Bailey on B400. Yhtä kirjainta seuraa aina kolme numeroa. 

 

Soundex rajoitukset 

Nimet, jotka kuulostavat samanlaisilta eivät aina omaa samaa soundex koodia. Esimerkiksi, Lee (L000) ja Leigh (L200) äännetään identtisesti, mutta niillä on erilainen soundex koodi, koska "hiljainen g" sanassa Leigh sisältää koodin. 

 

Nimet, jotka kuulostavat samanlaisilta, mutta alkavat erilaisella ensimmäisellä kirjaimella omaavat aina erilaisen soundex koodin. Täten, nimet kuten Carr (C600) ja Karr (K600) pitäisi laskea erikseen. 

 

Soundex perustuu englantilaiseen ääntämiseen, joten Euroopan nimet eivät koodaannu oikein. Esimerkiksi, jotkut ranskalaiset sukunimet "hiljaisella" viimeisellä kirjaimella eivät koodaannu ääntämisen mukaan. Tämä todentuu ranskalaisessa nimessä kuten Beaux - missä x on "hiljainen". Joskus tämä sukunimi kirjoitetaan myös Beau (B000) ja äännetään identtisesti Beaux (B200), kuitenkin niillä on erilaiset soundex koodit. Vaikka esimerkkinä on vain Ranska, niin tämä voi todentua kaikissa nimissä, jotka eivät käytä englantilaista ääntämystä. 

 

Joskus nimet, jotka eivät kuulosta samanlaisilta, omaavat samat soundex koodit. Kun etsit sukunimeä Powers (P620), joudut käymään lävitse sukunimien Pierce, Price, Perez ja Park, joilla kaikilla on sama soundex koodi. Kuitenkin Power (P600), yleisempi tapa kirjoittaa on Powers 100 vuotta sitten ja tällä on erilainen soundex koodi. 

 

Sukunimet, joissa on etuliite, olivat yleensä ilman etuliitettä, mutta ei aina. Mikäli olet etsimässä sukunimeä kuten DiCaprio tai LaBianca, sinun pitäisi yrittää soundex hakua etuliitteellä ja ilman etuliitettä. 

 

US väestörekisterin soundex sekavuus nousee esiin nimissä kuten Ashcraft. Kun alkuperäinen soundex koodari ei koodannut H-kirjainta ja eikä ottanut huomioon H-kirjainta erottimena vierekkäisten kirjainten välillä, joilla oli samat koodit S ja C, joten S ja C pidetään vierekkäisinä kirjaimina ja koodataan vain kerran, joten soundex on täten A261. Vuonna 1920 NY väestörekisteristä, Ashcraft löytyy koodilla A261, minkä tuloksen saat tämän sivun laskimella. 

 

Ne, jotka koodasivat soundex 1880*, 1900 ja 1910** väestörekisteritiedot ovat mahdollisesti voineet käyttää tai olla käyttämättä tämä sääntöä. Välillä he tulkitsivat H-kirjaimen erottimena ja eivät koodanneet S ja C -kirjaimia peräkkäisinä kirjaimina, jotka olisivat olleet vain yksi kirjain, vaan antoivat numerokoodin jokaiselle kirjaimelle. Tällöin Ashcraft olisi A226. 

 

On erittäin tärkeää tietää, ettei US väestörekisterin nimiä muodostettu käyttämällä H-kirjainta ja W-kirjainta erottimena vierekkäisten kirjainten välillä. Mikäli olet yrittänyt laskea soundex nimeä kirjaimilla W tai H, jotka erottavat kaksi vierekkäistä kirjainta, niin paras tapa on laskea soundex käyttämällä kahta erilaista menetelmää paikallistamaan nimi US väestörekisteristä. Tämä pitää paikkansa kaikissa nimissä, joissa on joku seuraavista kirjaimista C,S,G,J,K,Q,X,Z molemmin puolin kirjaimia H tai W kuten SHC, sHS, CHS, kHZ, SWS, kWS, CWK. 

 

Sukunimi, jossa on enemmän kuin yksi sana tai sukunimi, joka normaalisti tulee ennen etunimeä, kuten Native Americans ja Chinese sukunimet, voivat olla koodattuja nimenä, mikä ilmestyy viimeisimpänä, vaikka se ei olisikaan oikea sukunimi. Moniosaisista sukunimistä, vain viimeinen osa on koodattu. 

 

9-0169 / E Lahtomaa