====== Работа с .pdf ======
[[wiki:pdfjam|The pdfjam package for manipulating PDF files]].
Страница на моем веб-сайте полиграфии «Ея»: [[https://yeya.ru/wiki:imagemagick|ImageMagick]] Daily Usage.
===== Convert a directory of JPEG files to a single PDF document =====
convert *.jpg -auto-orient imagemagick.pdf
img2pdf - lossless conversion of raster images to pdf
img2pdf --output out.pdf page1.jpg page2.jpg # https://manpages.debian.org/bookworm/img2pdf/img2pdf.1.en.html#EXAMPLES
img2pdf --output Untitled.pdf *.jpeg # https://dragonserw.ru/wiki:pdf
img2pdf img1.tif --pagesize 107mmx150mm --imgsize 107mmx150mm --fit shrink --output file1.pdf #Пере-сохранение ТИФ в ПДФ с учетом размера бумаги
Наиболее часто встречается:
img2pdf --output Untitled.pdf *.jpg # https://dragonserw.ru/wiki:pdf
[[https://askubuntu.com/a/246653|AskUbuntu]].
Создание ПДФ из директории JPG и последующее OCR.
img2pdf --output Untitled.pdf *.jpg && ocrmypdf -l eng+rus Untitled.pdf 'SerW - OCRmyPDF.pdf' && rm Untitled.pdf # https://dragonserw.ru/wiki:pdf
===== Extracting embedded images from a PDF =====
pdfimages -all in.pdf /tmp/out # sudo pacman -S poppler
Source: [[https://askubuntu.com/questions/150100/extracting-embedded-images-from-a-pdf|AskUbuntu]].
===== Replace all font glyphs in a PDF by converting them to outline shapes =====
[[https://stackoverflow.com/a/28798374|Stack Overflow]]:
brew install ghostscript
alias gsu = 'gs -o Untitled-with-outlines.pdf -dNoOutputFonts -sDEVICE=pdfwrite Untitled.pdf'
gs -o Untitled_with-outlines.pdf -dNoOutputFonts -sDEVICE=pdfwrite Untitled.pdf
[[https://unixforum.org/viewtopic.php?f=90&t=152666|UnixForum-ORG]].
===== Covert .pdf to .png =====
[[https://yeya.ru/wiki:imagemagick|ImageMagick]]:
sudo dnf install ImageMagick -y
convert -density 300 my.pdf my.png # white background becomes transparent
MuPDF:mutool
sudo dnf install mupdf -y
mutool convert -O resolution=300 -o file.png file.pdf # background keeps untouched
Source: [[https://www.linux.org.ru/forum/general/17096759|Linux-ORG-RU]].
===== Склеивание нескольких документов =====
pdfunite in-1.pdf in-2.pdf out.pdf # https://stackoverflow.com/a/11280219
===== ocrmypdf.readthedocs.io =====
Оптическое распознавание английского и русского машинописного текста в отсканированных .pdf-документах.
ocrmypdf -l eng+rus Untitled.pdf OCRmyPDF.pdf
===== MuPDF -- разрезание .pdf по вертикали =====
brew install mupdf-tools
mutool poster -x 2 input.pdf output.pdf # poster -y
===== PostScript-to-PDF converter =====
Понижение качества картинок.
[[https://www.linux.org.ru/forum/multimedia/17308187?cid=17308196|Linux-ORG-RU]].
ps2pdf -dDownsampleColorImages=true -dColorImageResolution=300 source.pdf output-Downsample.pdf
Ребята, здорова!
Я хочу [[https://archlinux.com.ru/forum/viewtopic.php?t=1787|поделиться]] с вами своими находками работы в ПДФ из командной строки.
Мне всё это нужно практически ежедневно, поэтому есть жгучее желание выложить данные вещи.
Если кому-то будет интересно посмотреть за добалением информации по этой тематике на моей веб-сайте, милости прошу загуглить его и читать уже там, можно даже подписаться на новости :-)
Заранее прошу прощения за то, что команды по установке не арчевские, ну просто с Арчем я вообще не знаком, не знаю, как эти пакеты поставить туда.
Итак, милаости прошу внять моим находкам ))
Кстати, по возможности я указываю, где отыскал ту и иную информацию.