vendredi 8 février 2013

désaccentuation


J'oubliais, ce petit script pour "désaccentuer" du texte : utiliser entity_decode,
puisque é s'écrit &+e+acute; on peut récupérer le 'e' après le & :
function f_desaccentuation($v_str)

{
        //htmlentities pour les accents !: référence devient reference
        $str=f_str2utf8($v_str);
        $str=f_str2iso(html_entity_decode($str,ENT_NOQUOTES,"UTF-8"));
        $str=preg_replace("/[\xa0-\xbf\xd7\xf7]/"," ",$str);
        $str=htmlentities(f_str2utf8($str),ENT_NOQUOTES,"UTF-8");
        $str=str_replace(" "," ",$str);
        $str=str_replace("<","<",$str);
        $str=str_replace(">",">",$str);
        $str=str_replace("&","&",$str);
        $str=str_replace(""",'"',$str);
        $str=str_replace("'","'",$str);
        return(preg_replace("/\&(.)[^\;]*\;/","$1",$str));
}
pas de table de conversion :-)

Aucun commentaire: