Удалить BOM из строки на PHP
Кобзарёв Михаил
2016-10-07T12:08:43+00:00
Программирование
Удалить BOM из строки на PHP
Многие программы добавляют байты 0xEF
, 0xBB
, 0xBF
в начале любого документа, сохраняемого как UTF-8
. Это метка порядка байтов Юникода (англ. Byte Order Mark, BOM), также её часто называют сигнатурой (соответственно, UTF-8 и UTF-8 with Signature).
По наличию сигнатуры программы могут автоматически определить, является ли файл закодированным в UTF-8, однако файлы с такой сигнатурой могут некорректно обрабатываться старыми программами, xml-анализаторами и РНР.