У меня есть Ubuntu 10.04, работающая на Dell OptiPlex с 4 ГБ памяти и двух процессоров на 3.16 ГГц.
Я получил электронную таблицу 35 МБ. Это открылось в Gnumeric после 5 минут с ошибками, и это не открылось в, Открывают Office (уничтоженный после 20 минут) даже после того, как я уделил процессу "soffice" первостепенное значение (правильность =-20).
Что лучший способ состоит в том, чтобы иметь дело с таким файлом? Действительно ли возможно извлечь подмножество первой нескольких сотен строк так, чтобы я мог разработать сценарий, который я должен буду использовать для парсинга всего файла?
обновление:
Функция командной строки ssconvert BigFile.xlsx BigFile.csv
произведенный те же ошибки как Gnumeric (не удивляющий, потому что Gnumeric использует ssconvert
)
Вероятно, но Вам будет нужен некоторый физический труд.
файлы xslx являются на самом деле zip-файлами с данными XML в них. ПОЭТОМУ просто распакуйте файл и взгляните внутри. Формат не что-то, что нормальный ум легко поймет, но должно быть возможно открыть файлы листа, искать Row
элементы и полоса все после первой нескольких сотен.
С другой стороны, можно попытаться открыть файл с ПОИ Apache; просто дайте Java 1 ГБ RAM, и это могло бы работать.