Gibt den Soundex-Code für die angegebene Zeichenfolge zurück, der für phonetische Vergleiche mit anderen Zeichenfolgen verwendet werden kann.
Syntax
SOUNDEX(Name)
Parameter
Name | Typ | Beschreibung |
---|---|---|
Name | Zeichen | Gibt den auszuwertenden Zeichenausdruck an. |
Ausgabe
Zeichen. Gibt einen vierstelligen Soundex-Code zurück.
Beispiele
Einfache Beispiele
Wörter, die identisch klingen, aber anders geschrieben sind
Die beiden folgenden Beispiele geben denselben Soundex-Code zurück, weil sie identisch klingen. Ihre Schreibweise unterscheidet sich jedoch.
Gibt „F634“ zurück:
SOUNDEX("Fairdale")
Gibt „F634“ zurück:
SOUNDEX("Fairdale")
Wörter, die ähnlich klingen
Die beiden folgenden Beispiele geben Soundex-Codes zurück, die unterschiedlich, aber ähnlich sind, weil die beiden Wörter ähnlich klingen.
Gibt „J525“ zurück:
SOUNDEX("Jonson")
Gibt „J523“ zurück:
SOUNDEX("Jonston")
Wörter, die unterschiedlich klingen
Die beiden folgenden Beispiele geben Soundex-Codes zurück, die recht unterschiedlich sind, weil die beiden Wörter überhaupt nicht ähnlich klingen.
Gibt „S530“ zurück:
SOUNDEX("Smith")
Gibt „M235“ zurück:
SOUNDEX("MacDonald")
Feldeingabe
Gibt den Soundex-Code für die einzelnen Werte im Feld Nachname zurück:
SOUNDEX(Nachname)
Weiterführende Beispiele
Übereinstimmende Soundex-Codes finden
Erstellt das Kalkulationsfeld Soundex-Code, das den Soundex-Code für die einzelnen Werte im Feld Nachname anzeigt:
DEFINE FIELD Soundex-Code COMPUTED SOUNDEX(Nachname)
Fügen Sie das Feld Soundex-Code der Ansicht hinzu, um für das Kalkulationsfeld eine Duplikatprüfung zur Ermittlung von übereinstimmenden Soundex-Codes durchzuführen:
DUPLICATES ON Soundex-Code OTHER Nachname PRESORT OPEN TO "Mögliche_Duplikate.fil"
Übereinstimmende Soundex-Codes weisen darauf hin, dass es sich bei den entsprechenden Zeichenwerten im Feld Nachname um mögliche Duplikate handelt.
Bemerkungen
Wann Sie SOUNDEX( ) verwenden sollen
Mit der SOUNDEX( )-Funktion können ähnlich klingende Werte gefunden werden. Die phonetische Ähnlichkeit ist eine Möglichkeit, potenziell doppelte Werte oder inkonsistente Schreibweisen manuell eingegebener Daten zu finden.
Funktionsweise
SOUNDEX( ) gibt den American Soundex-Code für die ausgewertete Zeichenfolge zurück. Alle Codes bestehen aus einem Buchstaben gefolgt von drei Ziffern. Zum Beispiel: „F634“.
Wie der Soundex-Code ermittelt wird
- Das erste Zeichen im Code entspricht dem ersten Zeichen der ausgewerteten Zeichenfolge.
- Jede Zahl im Code entspricht einer der sechs American-Soundex-Gruppen. Die Gruppen bestehen aus phonetisch ähnlichen Konsonanten.
Anhand dieser Gruppen werden mit dem Soundex-Prozess die ersten drei auf den ersten Buchstaben folgenden Konsonanten der ausgewerteten Zeichenfolge codiert.
Was der Soundex-Prozess ignoriert
Der Soundex-Prozess ignoriert:
- Großschreibung
- Vokale
- die Konsonanten „H“, „W“ und „Y“
- alle Konsonanten, die auf die drei codierten Konsonanten folgen
Eine oder mehrere abschließende Nullen (0) im zurückgegeben Code weisen auf eine Zeichenfolge mit weniger als drei Konsonanten nach dem ersten Buchstaben hin.
Beschränkungen des Soundex-Prozesses
Sowohl die SOUNDEX( )- als auch die SOUNDSLIKE( )-Funktion haben bestimmte Einschränkungen:
- Der Soundex-Algorithmus wurde entwickelt, um mit Worten der englischen Sprache zu funktionieren, und ist von unterschiedlicher Effektivität, wenn dieser in anderen Sprachen eingesetzt wird.
- Obwohl das Soundex-Verfahren einen phonetischen Abgleich durchführt, müssen passende Worte alle mit demselben Buchstaben beginnen, was bedeutet, dass manche Worte, die sich gleich anhören nicht abgeglichen werden.
Obwohl Wörter, die mit „F“ und mit „Ph“ anfangen, gleich klingen können, würden diese Wörter nie zugeordnet werden.
Verwandte Funktionen
- SOUNDSLIKE( ) ist eine alternative Methode des phonetischen Vergleichs von Zeichenfolgen.
- ISFUZZYDUP( ) und LEVDIST vergleichen Zeichenfolgen anhand der Orthografie (Buchstabierung) anstatt der Phonetik (Klang).
- DICECOEFFICIENT( ) ignoriert beim Vergleich von Zeichenfolgen die relative Position von Zeichen oder Zeichenblöcken völlig oder berücksichtigt sie weniger stark.