PHP 7.1.0 Released

Codificaciones de caracteres admitidas

Actualmente, el módulo mbstring admite las siguientes condificaciones de caracteres. Cualesquiera de estas codificaciones de caracteres se pueden especificar en el parámetro encoding de las funciones de mbstring.

Esta extensión de PHP admite las siguientes codificaciones de caracteres:

  • UCS-4*
  • UCS-4BE
  • UCS-4LE*
  • UCS-2
  • UCS-2BE
  • UCS-2LE
  • UTF-32*
  • UTF-32BE*
  • UTF-32LE*
  • UTF-16*
  • UTF-16BE*
  • UTF-16LE*
  • UTF-7
  • UTF7-IMAP
  • UTF-8*
  • ASCII*
  • EUC-JP*
  • SJIS*
  • eucJP-win*
  • SJIS-win*
  • ISO-2022-JP
  • ISO-2022-JP-MS
  • CP932
  • CP51932
  • SJIS-mac** (alias: MacJapanese)
  • SJIS-Mobile#DOCOMO** (alias: SJIS-DOCOMO)
  • SJIS-Mobile#KDDI** (alias: SJIS-KDDI)
  • SJIS-Mobile#SOFTBANK** (alias: SJIS-SOFTBANK)
  • UTF-8-Mobile#DOCOMO** (alias: UTF-8-DOCOMO)
  • UTF-8-Mobile#KDDI-A**
  • UTF-8-Mobile#KDDI-B** (alias: UTF-8-KDDI)
  • UTF-8-Mobile#SOFTBANK** (alias: UTF-8-SOFTBANK)
  • ISO-2022-JP-MOBILE#KDDI** (alias: ISO-2022-JP-KDDI)
  • JIS
  • JIS-ms
  • CP50220
  • CP50220raw
  • CP50221
  • CP50222
  • ISO-8859-1*
  • ISO-8859-2*
  • ISO-8859-3*
  • ISO-8859-4*
  • ISO-8859-5*
  • ISO-8859-6*
  • ISO-8859-7*
  • ISO-8859-8*
  • ISO-8859-9*
  • ISO-8859-10*
  • ISO-8859-13*
  • ISO-8859-14*
  • ISO-8859-15*
  • ISO-8859-16*
  • byte2be
  • byte2le
  • byte4be
  • byte4le
  • BASE64
  • HTML-ENTITIES
  • 7bit
  • 8bit
  • EUC-CN*
  • CP936
  • GB18030**
  • HZ
  • EUC-TW*
  • CP950
  • BIG-5*
  • EUC-KR*
  • UHC (CP949)
  • ISO-2022-KR
  • Windows-1251 (CP1251)
  • Windows-1252 (CP1252)
  • CP866 (IBM866)
  • KOI8-R*
  • KOI8-U*
  • ArmSCII-8 (ArmSCII8)

* denota codificaciones que también pueden ser utilizadas en expresiones regulares.

** denota codificaciones que están disponibles desde PHP 5.4.0.

Cualquier entrada en php.ini que acepte un nombre de codificación también puede utilizar los valores "auto" y "pass". Las funciones de mbstring que aceptan un nombre de codificación también pueden utilizar el valor "auto".

Si se establece el valor "pass", no se realizará ninguna conversión de la codificación de caracteres.

Si se establece el valor "auto", se utilizará la lista de codificaciones definida por el NLS. Por ejemplo, si el NLS está configurado como Japanese, el valor que se asume será "ASCII,JIS,UTF-8,EUC-JP,SJIS".

Véase también mb_detect_order()

add a note add a note

User Contributed Notes 4 notes

up
10
akniep at rayo dot info
3 years ago
Use mb_list_encodings() to check if an encoding is supported by mbstring before using its functions for it.
up
4
Anonymous
2 years ago
CP850 (DOS-Latin-1) is also supported.
up
0
php dot net at chrisjj dot com
22 days ago
Despite that above says:

"Currently the following character encodings are supported by the mbstring module. Any of those Character encodings can be specified in the encoding parameter of mbstring functions.

The following character encodings are supported in this PHP extension:

[...]
Windows-1252 (CP1252)
"

"Windows-1252 (CP1252)" is an invalid as an mb_convert_encoding() encoding parameter value.

"Windows-1252" is valid.
up
-2
Tomolimo (olivier dot moron at raynet-it dot com)
3 years ago
Apart of this list, GB2312 encoding is also supported.
It is Chinese Simplified encoding which is now superseded by GB18030, but GB2312 is not in the list.
If you try to us it, the result will allright even if it is not in the list.
Regards,
Tomolimo
To Top