Я пытаюсь использовать xml документ, но сталкиваюсь с этой ошибкой:
Invalid byte 3 of 3-byte UTF-8 sequence
Мой документ выглядит примерно так ниже, но с большим количеством тегов и содержания. Не фокусируйтесь на документе ниже все же. Я использую несколько документов с этим форматом. Я полагаю, что это - символ в моем документе, это недопустимо, но я просто не знаю лучший способ найти его, потому что это является настолько большим.
Какие-либо идеи или инструменты я мог использовать?Спасибо.
Спасибо!
<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE map PUBLIC "-//OASIS//DTD DITA Map//EN" "file:C:/Documentum/Viewed/map.dtd">
<map xmlns:dctm="http://www.documentum.com" dctm:obj_status="Read-Only" dctm:obj_id="09002af8800af696" dctm:version_label="CURRENT" xmlns:ditaarch="http://dita.oasis-open.org/architecture/2005/">
<title>Overview of the Commercial General Liability (CGL) Insurance Coverages </title><moreTagsHere><!-- more tags here... --></moreTagsHere>
</map>
Я попробовал бы XMLStarlet:
[...] XMLStarlet является рядом утилит командной строки (инструменты), которые могут использоваться для преобразования, запросить, проверить, и отредактировать XML-документы и файлы с помощью простого набора команд оболочки похожим способом, которым он сделан для файлов простого текста с помощью UNIX grep, sed, awk, разности, управляет патч, соединение, и т.д. [...]
[шахта акцента]
У меня есть подлое подозрение, можно использовать инструмент Microsoft.
По моему опыту, сеть Выражения раньше помещала информацию заголовка в текстовые файлы для идентификации их как, чем когда-либо формат они были - ничто иное не распознало их, и они обнаружились как случайные символы. Это было особенно проблемой с PHP, поскольку он повредился, включает.
Забудьте факт, это - XML, необходимо проверить UTF-8. Возможно, просто откройтесь в Firefox и ищите символ �? Иначе см. проверку UTF-8 на Переполнении стека.
Вы, вероятно, использовали редактора, который добавляет Порядок байтов Mark (BOM) к файлу. многие/больше всего редакторы/веб-сайт xml редакторы позволяют Вам сохранять документ с/без BOM. Проверьте опции сохранения в любого редактора, которого Вы использовали.
Вероятно, необходимо удалить BOM для предотвращения ошибки.
Если Ваш редактор не поддерживает ту опцию, я могу рекомендовать превосходный Блокнот ++