Проблема с документом: Недопустимый байт 3 из 3-байтовой последовательности UTF-8

Я пытаюсь использовать xml документ, но сталкиваюсь с этой ошибкой:

Invalid byte 3 of 3-byte UTF-8 sequence

Мой документ выглядит примерно так ниже, но с большим количеством тегов и содержания. Не фокусируйтесь на документе ниже все же. Я использую несколько документов с этим форматом. Я полагаю, что это - символ в моем документе, это недопустимо, но я просто не знаю лучший способ найти его, потому что это является настолько большим.

Какие-либо идеи или инструменты я мог использовать?Спасибо.

Спасибо!

<?xml version="1.0" encoding="UTF-8"?>
<!DOCTYPE map PUBLIC "-//OASIS//DTD DITA Map//EN" "file:C:/Documentum/Viewed/map.dtd">
<map xmlns:dctm="http://www.documentum.com" dctm:obj_status="Read-Only" dctm:obj_id="09002af8800af696" dctm:version_label="CURRENT" xmlns:ditaarch="http://dita.oasis-open.org/architecture/2005/">
    <title>Overview of the Commercial General Liability (CGL) Insurance Coverages  </title><moreTagsHere><!-- more tags here... --></moreTagsHere>
</map>
2
задан 21.08.2009, 23:57

5 ответов

В моем xml была недопустимая изогнутая кавычка.

1
ответ дан 12.12.2019, 00:37

Я попробовал бы XMLStarlet:

[...] XMLStarlet является рядом утилит командной строки (инструменты), которые могут использоваться для преобразования, запросить, проверить, и отредактировать XML-документы и файлы с помощью простого набора команд оболочки похожим способом, которым он сделан для файлов простого текста с помощью UNIX grep, sed, awk, разности, управляет патч, соединение, и т.д. [...]
[шахта акцента]

0
ответ дан 12.12.2019, 00:37

У меня есть подлое подозрение, можно использовать инструмент Microsoft.

По моему опыту, сеть Выражения раньше помещала информацию заголовка в текстовые файлы для идентификации их как, чем когда-либо формат они были - ничто иное не распознало их, и они обнаружились как случайные символы. Это было особенно проблемой с PHP, поскольку он повредился, включает.

0
ответ дан 12.12.2019, 00:37

Забудьте факт, это - XML, необходимо проверить UTF-8. Возможно, просто откройтесь в Firefox и ищите символ �? Иначе см. проверку UTF-8 на Переполнении стека.

0
ответ дан 12.12.2019, 00:37

Вы, вероятно, использовали редактора, который добавляет Порядок байтов Mark (BOM) к файлу. многие/больше всего редакторы/веб-сайт xml редакторы позволяют Вам сохранять документ с/без BOM. Проверьте опции сохранения в любого редактора, которого Вы использовали.

Вероятно, необходимо удалить BOM для предотвращения ошибки.

Если Ваш редактор не поддерживает ту опцию, я могу рекомендовать превосходный Блокнот ++

0
ответ дан 12.12.2019, 00:37

Теги

Похожие вопросы