huge success
Dec. 26th, 2010 09:11 pmНаписал читалку-писалку PDF’ок. Т.е. парсер+сериализатор. Читает, делает AST, конвертирует в нормализованный “граф элементов”, конвертирует обратно в AST, генерит метаданные, пишет.
А то все известные либы – это либо писалки, либо читалки, либо split-merge. Ребилд никто делать не умеет :/
На полноту не претендует (не знаю, что делать с многосекционными xref-таблицами, по смыслу задачи их надо выбрасывать), ну и смысловой анализ тоже никакой не делается, просто нормализация. И stream filters пока в процессе.
Сцуко, две недели, много нервов и исписанных листочков. Чортов Adobe.
А, да. Никто случайно не занимался вотермаркингом графов? :)
no subject
Date: 2010-12-27 10:23 am (UTC)а с библиотеками определенно беда, из нормальных только Adobe PDF Library знаю да poppler. причем первый стоит определенно слишком много денег, а у второго с портабельностью проблемы
по работе вот такую штуку пришлось наваять: https://github.com/explicitcall/PDForm. в итоге все же перепишу ее на QML + poppler, когда руки дойдут