Кодировка GSM-7 позволяет посылать 160 символов за одно сообщение, UCS‑2 поддерживает любой язык и занимает 70 символов, а многочастные сообщения автоматически разбиваются при длине более 160 (GSM‑7) или 70 (UCS‑2).
1. Что такое кодировка SMS?
Кодировка – способ преобразования текста в набор байтов, которые телефонный оператор может доставить. В SMS существует два основных стандарта: GSM‑7 и UCS‑2. Выбор кодировки влияет на длину сообщения, стоимость и доставляемость.
Почему важно знать кодировку?
- Гарантирует целостность текста при пересылке.
- Определяет ценовую политику для сообщений.
- Уменьшает риск обрезки сообщения.
2. GSM‑7 – самая популярная кодировка
GSM‑7 использует 7‑битовый набор символов, поддерживаемый всеми мобильными сетями. Включает латинские буквы, цифры, символы знаков препинания и ограниченный набор спецсимволов. Каждый символ занимает 7 бит, а одно SMS‑сообщение ограничено 160 символами.
Как работает сегментация в GSM‑7?
Если сообщение превышает 160 символов, оно разбивается на многочастные пакеты. Каждый пакет содержит 7 бит на символ + 6 бит заголовка, в итоге размер пакета – 153 символа.
function splitGSM7(message) {
const partSize = 153;
return message.match(new RegExp(".{1," + partSize + "}", "g"));
}Преимущества GSM‑7
- Низкая стоимость (часто 1 рубль на пакет).
- Высокая совместимость.
- Поддержка большинства рекламных и транзакционных шаблонов.
3. UCS‑2 – Unicode для любых языков
UCS‑2 использует 16‑битовый набор символов, что позволяет отправлять любые языки (Китайский, Арабский, Кириллица и др.). В одном пакете помещается 70 символов.
Как это влияет на маркетинг?
- Для стран с нелатинским алфавитом – обязательный выбор.
- Увеличивает стоимость, так как пакет более короткий.
- Необходима проверка
encodingперед отправкой.
4. Многочастные сообщения: правила и практика
При использовании GSM‑7 или UCS‑2, когда длина превышает 1 пакет, сообщение делится. Важно помнить, что каждая часть считается отдельным SMS, чтобы не сбить отправителя и не порог цены.
Важные нюансы:
- Каждая часть содержит заголовок
UDH(User Data Header), который кодирует порядок. - Включение заголовка уменьшает доступное место: 153 символа (GSM‑7) и 67 символов (UCS‑2).
- Пользователь может увидеть части как «…(ор)» в конце.
Best practices для многочастных сообщений
- Ограничить длину до двух частей, если это критично.
- Использовать сторонний сервис, который автоматически обрабатывает сегментацию.
- Включить в шаблоны
{{segment_number}}для динамической маркировки.
5. Как выбрать правильную кодировку в SMS‑маркетинге
Выбор зависит от целевой аудитории и цели кампании. Ниже таблица сравнения:
| Кодировка | Длина однораз | Длина части (многочастные) | Поддерживаемые языки |
|---|---|---|---|
| GSM‑7 | 160 | 153 | Латиница, ограниченный набор символов |
| UCS‑2 | 70 | 67 | Все Unicode, включая Арабский, Китайский, Кириллицу |
Рекомендации:
- Если ваш бренд ориентирован на рынки с нелатинскими алфавитами – выбирайте UCS‑2.
- Для рекламных акций в России и СНГ GSM‑7 обычно более экономичен.
- Проверяйте кодировку перед отправкой через API: Как работает SMS API.
6. FAQ – Часто задаваемые вопросы
- Как определить кодировку в исходном сообщении?
- Посмотрите диапазон символов: если есть символы не в таблице GSM‑7, используйте UCS‑2.
- Можно ли менять кодировку динамически?
- Да, большинство SMS‑провайдеров позволяют задавать параметр
encodingв запросе. - Учитывается ли длина части при оплате?
- Да, каждая часть считается отдельной SMS и оплачивается как таковая.
7. Заключение
Понимание GSM‑7, UCS‑2 и многочастных сообщений позволит вам оптимизировать расходы, повысить достоверность доставляемости и адаптировать контент под международную аудиторию. Правильный выбор кодировки – ключ к эффективной SMS‑кампании.
Для дальнейшего изучения и практических кейсов ознакомьтесь с материалами: