Fork me on GitHub

The WebDevil

Enjoy development

$config = array(
  'doctype' => "strict",
  'indent' => 'auto',
  'output-xhtml' => true,
  'wrap' => 90,
  'show-body-only' => true,
  'enclose-block-text' => true
);

$encoding="raw";

$tidy = new tidy;
$tidy->parseString($text, $config, $encoding);
$tidy->cleanRepair();
return "$tidy";

При работе с текстом в cp1251 все замечательно, при utf8 имеем знаки вопроса когда встречается два и более пробелов.
Лечение:

$encoding="utf8";

2 Responses to “Tidy”

  1. Гм. Тайди умеет с ср1251 работать? Я думал что только с тем работает что в мане сказано:
    input-encoding
    Type: Encoding
    Default: latin1
    Example: raw, ascii, latin0, latin1, utf8, iso2022, mac, win1252, ibm858, utf16le, utf16be, utf16, big5, shiftjis

    И делал конверт в utf, чистил и потом назад.. Или это от локали зависит?

    Andrew

  2. Если указать $encoding=”raw” то работает ;)

    dm