Soundex算法的一些变化
此算法设置为运行第一个单词或直到它填充四个编码的字符串。 例如,输入“可怕的伟大”的结果是:H612。 它忽略第二个单词,换句话说,它只需要第二个单词的第一个字母来填充编码的字符串。
我想通过取第一个单词并找到它的编码字符串来改变它,然后取第二个单词并找到它的编码字符串; 输出应该是“H614 G600”。 请亲切地想知道是否有办法通过改变**代码来做到这一点。
非常感谢 :)
private string Soundex(string data)
{
StringBuilder result = new StringBuilder();
if (data != null && data.Length > 0)
{
string previousCode = "", currentCode = "", currentLetter = "";
result.Append(data.Substring(0, 1));
for (int i = 1; i < data.Length; i++)
{
currentLetter = data.Substring(i,1).ToLower();
currentCode = "";
if ("bfpv".IndexOf(currentLetter) > -1)
currentCode = "1";
else if ("cgjkqsxz".IndexOf(currentLetter) > -1)
currentCode = "2";
else if ("dt".IndexOf(currentLetter) > -1)
currentCode = "3";
else if (currentLetter == "l")
currentCode = "4";
else if ("mn".IndexOf(currentLetter) > -1)
currentCode = "5";
else if (currentLetter == "r")
currentCode = "6";
if (currentCode != previousCode)
result.Append(currentCode);
if (result.Length == 4) break;
if (currentCode != "")
previousCode = currentCode;
}
}
if (result.Length < 4)
result.Append(new String('0', 4 - result.Length));
return result.ToString().ToUpper();
}
当然,这是我提出的解决方案。 我用另一种分割字符串并调用原始方法的方法封装了现有的算法。 要使用它,你可以调用SoundexByWord(“Horrible Great”)而不是调用Soundex(“Horrible Great”)并获得“H614 G630”的输出。
private string SoundexByWord(string data)
{
var soundexes = new List<string>();
foreach(var str in data.Split(' ')){
soundexes.Add(Soundex(str));
}
#if Net35OrLower
// string.Join in .Net 3.5 and before require the second parameter to be an array.
return string.Join(" ", soundexes.ToArray());
#endif
// string.Join in .Net 4 has an overload that takes IEnumerable<string>
return string.Join(" ", soundexes);
}
是的 - 首先将字符串解析为一个单词数组(在选择分隔符后)
然后在每个单词上做这个
然后以一些可接受的方式组装结果并返回。
问题中的实现是正确的,但会在字符串操作中创建多余的垃圾。 这是一个基于Char数组的实现,速度更快,创建的垃圾非常少。 它被设计为一个扩展方法,并且它处理短语(由空格分隔的单词):
public static String Soundex( this String input )
{
var words = input.Split( ' ' );
var result = new String[ words.Length ];
for( var i = 0; i < words.Length; i++ )
result[ i ] = words[ i ].SoundexWord();
return String.Join( ",", result );
}
private static String SoundexWord( this String input )
{
var result = new Char[ 4 ] { '0', '0', '0', '0' };
var inputArray = input.ToUpper().ToCharArray();
if( inputArray.Length > 0 )
{
var previousCode = ' ';
var resultIndex = 0;
result[ resultIndex ] = inputArray[ 0 ];
for( var i = 1; i < inputArray.Length; i++ )
{
var currentLetter = inputArray[ i ];
var currentCode = ' ';
if( "BFPV".IndexOf( currentLetter ) > -1 )
currentCode = '1';
else if( "CGJKQSXZ".IndexOf( currentLetter ) > -1 )
currentCode = '2';
else if( "DT".IndexOf( currentLetter ) > -1 )
currentCode = '3';
else if( currentLetter == 'L' )
currentCode = '4';
else if( "MN".IndexOf( currentLetter ) > -1 )
currentCode = '5';
else if( currentLetter == 'R' )
currentCode = '6';
if( currentCode != ' ' && currentCode != previousCode )
result[ ++resultIndex ] = currentCode;
if( resultIndex == 3 ) break;
if( currentCode != ' ' )
previousCode = currentCode;
}
}
return new String( result );
}
链接地址: http://www.djcxy.com/p/55231.html