====== Работа с .pdf ====== [[wiki:pdfjam|The pdfjam package for manipulating PDF files]]. Страница на моем веб-сайте полиграфии «Ея»: [[https://yeya.ru/wiki:imagemagick|ImageMagick]] Daily Usage. ===== Convert a directory of JPEG files to a single PDF document ===== convert *.jpg -auto-orient imagemagick.pdf img2pdf - lossless conversion of raster images to pdf img2pdf --output out.pdf page1.jpg page2.jpg # https://manpages.debian.org/bookworm/img2pdf/img2pdf.1.en.html#EXAMPLES img2pdf --output Untitled.pdf *.jpeg # https://dragonserw.ru/wiki:pdf img2pdf img1.tif --pagesize 107mmx150mm --imgsize 107mmx150mm --fit shrink --output file1.pdf #Пере-сохранение ТИФ в ПДФ с учетом размера бумаги Наиболее часто встречается: img2pdf --output Untitled.pdf *.jpg # https://dragonserw.ru/wiki:pdf [[https://askubuntu.com/a/246653|AskUbuntu]]. Создание ПДФ из директории JPG и последующее OCR. img2pdf --output Untitled.pdf *.jpg && ocrmypdf -l eng+rus Untitled.pdf 'SerW - OCRmyPDF.pdf' && rm Untitled.pdf # https://dragonserw.ru/wiki:pdf ===== Extracting embedded images from a PDF ===== pdfimages -all in.pdf /tmp/out # sudo pacman -S poppler Source: [[https://askubuntu.com/questions/150100/extracting-embedded-images-from-a-pdf|AskUbuntu]]. ===== Replace all font glyphs in a PDF by converting them to outline shapes ===== [[https://stackoverflow.com/a/28798374|Stack Overflow]]: brew install ghostscript alias gsu = 'gs -o Untitled-with-outlines.pdf -dNoOutputFonts -sDEVICE=pdfwrite Untitled.pdf' gs -o Untitled_with-outlines.pdf -dNoOutputFonts -sDEVICE=pdfwrite Untitled.pdf [[https://unixforum.org/viewtopic.php?f=90&t=152666|UnixForum-ORG]]. ===== Covert .pdf to .png ===== [[https://yeya.ru/wiki:imagemagick|ImageMagick]]: sudo dnf install ImageMagick -y convert -density 300 my.pdf my.png # white background becomes transparent MuPDF:mutool sudo dnf install mupdf -y mutool convert -O resolution=300 -o file.png file.pdf # background keeps untouched Source: [[https://www.linux.org.ru/forum/general/17096759|Linux-ORG-RU]]. ===== Склеивание нескольких документов ===== pdfunite in-1.pdf in-2.pdf out.pdf # https://stackoverflow.com/a/11280219 ===== ocrmypdf.readthedocs.io ===== Оптическое распознавание английского и русского машинописного текста в отсканированных .pdf-документах. ocrmypdf -l eng+rus Untitled.pdf OCRmyPDF.pdf ===== MuPDF -- разрезание .pdf по вертикали ===== brew install mupdf-tools mutool poster -x 2 input.pdf output.pdf # poster -y ===== PostScript-to-PDF converter ===== Понижение качества картинок. [[https://www.linux.org.ru/forum/multimedia/17308187?cid=17308196|Linux-ORG-RU]]. ps2pdf -dDownsampleColorImages=true -dColorImageResolution=300 source.pdf output-Downsample.pdf Ребята, здорова! Я хочу [[https://archlinux.com.ru/forum/viewtopic.php?t=1787|поделиться]] с вами своими находками работы в ПДФ из командной строки. Мне всё это нужно практически ежедневно, поэтому есть жгучее желание выложить данные вещи. Если кому-то будет интересно посмотреть за добалением информации по этой тематике на моей веб-сайте, милости прошу загуглить его и читать уже там, можно даже подписаться на новости :-) Заранее прошу прощения за то, что команды по установке не арчевские, ну просто с Арчем я вообще не знаком, не знаю, как эти пакеты поставить туда. Итак, милаости прошу внять моим находкам )) Кстати, по возможности я указываю, где отыскал ту и иную информацию.