Компьютерные услуги, город Ейск

Г. Ейск, улица Армавирская, дом 45, этаж II, кабинет № 221

Site Tools


wiki:pdf

Differences

This shows you the differences between two versions of the page.

Link to this comparison view

Both sides previous revisionPrevious revision
Next revision
Previous revision
wiki:pdf [2023/11/22 23:01] serwwiki:pdf [2025/01/20 12:30] (current) serw
Line 1: Line 1:
 +====== Работа с .pdf ======
  
 +[[wiki:pdfjam|The pdfjam package for manipulating PDF files]].
 +
 +Страница на моем веб-сайте полиграфии «Ея»: [[https://yeya.ru/wiki:imagemagick|ImageMagick]] Daily Usage.
 +
 +===== Convert a directory of JPEG files to a single PDF document =====
 +
 +<code=bash>
 +convert *.jpg -auto-orient imagemagick.pdf
 +</code>
 +
 +img2pdf - lossless conversion of raster images to pdf
 +
 +<WRAP prewrap>
 +<code=bash>
 +img2pdf --output out.pdf page1.jpg page2.jpg # https://manpages.debian.org/bookworm/img2pdf/img2pdf.1.en.html#EXAMPLES
 +img2pdf --output Untitled.pdf *.jpeg # https://dragonserw.ru/wiki:pdf
 +img2pdf img1.tif --pagesize 107mmx150mm --imgsize 107mmx150mm --fit shrink --output file1.pdf #Пере-сохранение ТИФ в ПДФ с учетом размера бумаги
 +</code>
 +</WRAP>
 +
 +Наиболее часто встречается:
 +
 +<WRAP prewrap>
 +<code=bash>
 +img2pdf --output Untitled.pdf *.jpg # https://dragonserw.ru/wiki:pdf
 +</code>
 +</WRAP>
 +
 +[[https://askubuntu.com/a/246653|AskUbuntu]].
 +
 +Создание ПДФ из директории JPG и последующее OCR.
 +
 +<WRAP prewrap>
 +<code=bash>
 +img2pdf --output Untitled.pdf *.jpg && ocrmypdf -l eng+rus Untitled.pdf 'SerW - OCRmyPDF.pdf' && rm Untitled.pdf # https://dragonserw.ru/wiki:pdf
 +</code>
 +</WRAP>
 +
 +===== Extracting embedded images from a PDF =====
 +
 +<code=bash>
 +pdfimages -all in.pdf /tmp/out # sudo pacman -S poppler
 +</code>
 +
 +Source: [[https://askubuntu.com/questions/150100/extracting-embedded-images-from-a-pdf|AskUbuntu]].
 +
 +===== Here's some examples of how to use pdftoppm to convert a PDF to a bunch of image files =====
 +
 +[[https://askubuntu.com/questions/150100/extracting-embedded-images-from-a-pdf/1187844#1187844|How to convert a PDF into a bunch of images]]:
 +
 +<code=bash>
 +mkdir -p images && pdftoppm -png -r 300 mypdf.pdf images/page
 +</code>
 +
 +===== Replace all font glyphs in a PDF by converting them to outline shapes =====
 +
 +[[https://stackoverflow.com/a/28798374|Stack Overflow]], installation and Alias:
 +
 +<code=bash>
 +brew install ghostscript
 +alias gsu = 'gs -o Untitled-with_outlines.pdf -dNoOutputFonts -sDEVICE=pdfwrite Untitled.pdf'
 +</code>
 +
 +Usage:
 +<code=bash>
 +gs -o Untitled-with_outlines.pdf -dNoOutputFonts -sDEVICE=pdfwrite Untitled.pdf
 +</code>
 +
 +[[https://unixforum.org/viewtopic.php?f=90&t=152666|UnixForum-ORG]].
 +
 +===== Covert .pdf to .png =====
 +
 +[[https://yeya.ru/wiki:imagemagick|ImageMagick]]:
 +
 +<code=bash>
 +sudo dnf install ImageMagick -y
 +convert -density 300 my.pdf my.png # white background becomes transparent
 +</code>
 +
 +MuPDF:mutool
 +
 +<code=bash>
 +sudo dnf install mupdf -y
 +mutool convert -O resolution=300 -o file.png file.pdf # background keeps untouched
 +</code>
 +
 +Source: [[https://www.linux.org.ru/forum/general/17096759|Linux-ORG-RU]].
 +
 +===== Склеивание нескольких документов =====
 +
 +<code=bash>
 +pdfunite in-1.pdf in-2.pdf out.pdf # https://stackoverflow.com/a/11280219
 +</code>
 +
 +===== ocrmypdf.readthedocs.io =====
 +
 +Оптическое распознавание английского и русского машинописного текста в отсканированных .pdf-документах. 
 +
 +<code=bash>
 +ocrmypdf -l eng+rus Untitled.pdf OCRmyPDF.pdf
 +</code>
 +
 +===== MuPDF -- разрезание .pdf по вертикали =====
 +
 +<code=bash>
 +brew install mupdf-tools
 +mutool poster -x 2 input.pdf output.pdf # poster -y
 +</code>
 +
 +===== PostScript-to-PDF converter =====
 +
 +Понижение качества картинок.
 +[[https://www.linux.org.ru/forum/multimedia/17308187?cid=17308196|Linux-ORG-RU]].
 +
 +<code=bash>
 +ps2pdf -dDownsampleColorImages=true -dColorImageResolution=300 source.pdf output-Downsample.pdf
 +</code>
 +
 +Ребята, здорова!
 +
 +Я хочу [[https://archlinux.com.ru/forum/viewtopic.php?t=1787|поделиться]] с вами своими находками работы в ПДФ из командной строки.
 +
 +Мне всё это нужно практически ежедневно, поэтому есть жгучее желание выложить данные вещи.
 +
 +Если кому-то будет интересно посмотреть за добалением информации по этой тематике на моей веб-сайте, милости прошу загуглить его и читать уже там, можно даже подписаться на новости :-)
 +
 +Заранее прошу прощения за то, что команды по установке не арчевские, ну просто с Арчем я вообще не знаком, не знаю, как эти пакеты поставить туда.
 +
 +Итак, милаости прошу внять моим находкам ))
 +
 +Кстати, по возможности я указываю, где отыскал ту и иную информацию.