Categories
.NET ASP.NET

Eliminando acentos con .NET 1.x

En la entrada anterior vimos que con .NET 2 la eliminación acentos (y otros diacríticos) es una tarea trivial, pues bien
para hacer esta misma tarea con Mono -que al parecer no tiene implementado esta parte todavía- o versiones anteriores del .NET Framework 2, se puede usar el API de la función FoldString
o tomar parte del código de VietPad, escrito por Quan Nguyen.

csharp:

public class Program
{
    #region Foldstring
    [Flags]
    private enum MapFlags
    {
        MAP_FOLDCZONE = 0x00000010,// fold compatibility zone chars
        MAP_PRECOMPOSED = 0x00000020,// convert to precomposed chars
        MAP_COMPOSITE = 0x00000040, // convert to composite chars
        MAP_FOLDDIGITS = 0x00000080 // all digits to ASCII 0-9
    }
    [DllImport("kernel32.dll")]
    static extern int FoldString(int dwMapFlags, string lpSrcStr, int cchSrc,
       [Out] StringBuilder lpDestStr, int cchDest);

    public static string RemoveDiacritics1(string stIn)
    {
        StringBuilder sb = new StringBuilder();
        FoldString((int)MapFlags.MAP_COMPOSITE, stIn, stIn.Length, sb, stIn.Length * 2);
        return Regex.Replace(sb.ToString(), @"\p{Sk}", "");
    }
    #endregion

    #region Utilizando parte del código de VietPad
    public static string RemoveDiacritics2(string strIn)
    {
        Normalizer n = new Normalizer(Normalizer.D);
        return Regex.Replace(n.normalize(strIn), "\p{Mn}+", "");
    }
    #endregion

    public static void Main(string[] args)
    {
        string str = "Canción";
        // Usando API de FoldString
        Console.WriteLine(RemoveDiacritics1(str));
        // Usando parte del código de VietPad (http://vietpad.sourceforge.net)
        Console.WriteLine(RemoveDiacritics2(str));
        Console.Read();
    }
}

Nota1: Por alguna extraña razón, al compilar desde Visual Studio 2003 no funciona bien el ejemplo cuando
se usa FoldString, pero si se compila desde la línea de comandos no hay ningún problema

Nota2: No he probado el funcionamiento del código en Mono para Windows.

Archivos Relacionados

3 replies on “Eliminando acentos con .NET 1.x”

pruebo con el de NET 2.0 y me va ok, pero de verdad que no entiendo nada del foldstring ni de los mapflags, ya me estoy deseperando

[...] Siguiendo la tradición, a continuación una función básica que elimina las tildes de las urls. sql:CREATE OR REPLACE FUNCTION sanitize_url(VARCHAR) RETURNS VARCHAR AS $$ SELECT trim('-' FROM regexp_replace(lower(to_ascii($1)), '[ -]+', '-', 'g')); $$ LANGUAGE sql; [...]

Comments are closed.