инструменты/текст/инспектор строки
// текстnew

инспектор строки

длина, байты, unicode, энтропия, частота символов

символы
байты (utf-8)
слова
строки
уникальных символов
энтропия (бит/символ)
частота символов
вставьте текст…

              curl -sX POST 'https://api.whittly.dev/v1/string/inspect' \
  -H 'Authorization: Bearer $WHITTLY_API_KEY' \
  -H 'Content-Type: application/json' \
  -d '{"input":"hello, world!"}'
            

              const res = await fetch('https://api.whittly.dev/v1/string/inspect', {
  method: 'POST',
  headers: {
    'Authorization': 'Bearer ' + apiKey,
    'Content-Type': 'application/json',
  },
  body: JSON.stringify({ input: "hello, world!" }),
});
const data = await res.json();
            

              const { data } = await axios.post(
  'https://api.whittly.dev/v1/string/inspect',
  { input: "hello, world!" },
  { headers: { Authorization: 'Bearer ' + apiKey } }
);
            
// proсинхронизация историиpro·пакетный анализ через APIproподробнее →

// о инструменте

Текст сложнее чем кажется — длина строки в байтах отличается от количества символов при наличии многобайтовых Unicode-символов (emoji, CJK, буквы с диакритикой). Энтропия Шеннона измеряет информационную плотность строки и позволяет обнаружить паттерны или случайность.

// когда использовать

  • Проверить влезет ли строка в байтовый лимит колонки БД
  • Обнаружить высокоэнтропийные строки — токены или пароли
  • Проанализировать распределение символов в текстовых данных
  • Найти невидимые символы или пробелы нулевой ширины

// faq

Почему количество байт отличается от числа символов?
UTF-8 использует 1 байт для ASCII, 2 байта для латиницы Extended и греческого, 3 байта для большинства CJK и emoji, 4 байта для дополнительных emoji. Один emoji 🔥 — это 1 символ, но 4 байта.
Что такое энтропия Шеннона?
Энтропия Шеннона измеряет среднее количество информации на символ. Строка из одинаковых символов имеет энтропию 0. Случайная строка байт — около 8 бит. Пароли должны иметь высокую энтропию; естественный язык — обычно 4–5 бит на символ.
// история
Pro Облачная синхронизация — подробнее
операций пока нет