Поиск

Big data


Вчера в очередной раз столкнулся с проблемой загрузки статьи в arXiv. Хотя текущее ограничение на объем в 5 Мб выглядит разумным, но когда в статье публикуется большое количество картинок превысить это значение ничего не стоит. jpeg2ps позволяет решить эту проблему, генерируя EPS-«обертку» вокруг сжатого JPEG изображения. К сожалению, convert из ImageMagic не решает эту проблему. Может я туп, но сходу не получилось подобрать подходящие ключи. convert при записи EPS разворачивает JPEG в BitMap, в результате чего выигрыша в размерах добиться не получается.

К моему удивлению, подготовка картинок для arXiv превратилась в настоящую эпопею.

Вначале, пришлось освоить работу с ghostscript для создания JPEG-изображения с заданным разрешением и ограниченную внутри BoundingBox. По ходу дела выяснилось, что MATLAB генерирует EPS который ghostscript не воспринимает (требуется, чтобы BoundingBox был определен в заголовке файла, а MATLAB создает отсылку в конец файла). Просто сделать новые картинки в МАТЛАБе было не вариант, так как после краха системы его нужно переустанавливать, а на это нет времени.

На следующем шаге выяснилось, что jpeg2ps отсутствует в репозитории Ubuntu, а есть только тарбол, который еще надо как-то установить. Легких путей мы не ищем, поэтому пришлось разобраться как делать установочные .deb пакеты из тарболов с помощью checkinstall (alien наворотил что-то несуразное, так что пришлось сносить не только криво поставленный пакет, но и сам alien).

Дальнейшие шаги были простыми:
а) перевести все EPS тяжелее 1Мб сначала в JPG, а потом вновь в EPS
б) все скомпилить, проверить, загрузить в arXiv.
в) выяснить, что arXiv по какой-то причине не знает пакета mnras.cls
г) добавить mnras.cls вручную
д) выяснить, что на дворе уже пятница и статья будет опубликована в arXiv только в понедельник. makarov_d_i.livejournal.com

Добавить комментарий