If iconv_strlen is passed a UTF-8 string containing badly formed sequences, it will return FALSE. This is in contrast to mb_strlen of the behaviour of utf8_decode, which strip out any bad sequences;
<?php
# UTF-8 string containing bad sequence: \xe9
$str = "Iñtërnâtiôn\xe9àlizætiøn";
print "mb_strlen: ".mb_strlen($str,'UTF-8')."\n";
print "strlen/utf8_decode: ".strlen(utf8_decode($str))."\n";
print "iconv_strlen: ".iconv_strlen($str,'UTF-8')."\n";
?>
Displays;
mb_strlen: 20
strlen/utf8_decode: 20
iconv_strlen:
(PHP 5.0.5)
As such it is being "stricter" than mb_strlen and it may mean you need to check for invalid sequences first. A quick way to check is to exploit the behaviour of the PCRE extension (see notes on pattern modifiers);
<?php
if (preg_match('/^.{1}/us',$str,$ar) != 1) {
die("string contains invalid UTF-8");
}
?>
A slower but stricter check (regex) can be found at: http://www.w3.org/International/questions/qa-forms-utf-8
Similiar applies to iconv_substr, iconv_strpos and iconv_strrpos
iconv_strlen
(PHP 5)
iconv_strlen — Retorna el número de caracteres de un string
Descripción
int iconv_strlen
( string
$str
[, string $charset = ini_get("iconv.internal_encoding")
] )
A diferencia de strlen(),
iconv_strlen() cuenta el número de veces que aparece
cierta secuencia de bytes str en base a la
codificación de caraceters especificada, resultado que no es necesariamente
igual a la longitud del string en bytes.
Parámetros
-
str -
El string a contar.
-
charset -
Si se omite el parametro
charset, se asume questrse codificará en iconv.internal_encoding.
Valores devueltos
Retorna el número de caracteres de str, como un
entero.
Ver también
- strlen() - Obtiene la longitud de un string
- mb_strlen() - Obtiene la longitud de una cadena de caracteres
hfuecks @ nospam org ¶
7 years ago
