Как да премахнете воден знак от pdf. Как да премахнете воден знак от PDF файл? Премахване на водния знак

Споменах моята ръчно правенокак да премахнете водни знаци от pdf файлове, изтеглени от ProQuest.

« Моля, имайте предвид, че страниците на изтегления pdf файл "out.pdf" са релефни с воден знак "PREVIEW", за да се защити нещо там. Може би такъв надпис се появява само в пробната версия на достъп до ProQuest. Или може би не. Няма да лъжа - не знам.

Ако някой „обича“ да вижда този „воден знак“ във файла, тогава така да бъде. Но за някои естети, като мен, той е ужасно досаден. За да отговорят на нуждите на работещите хора по целия свят, опитни програмисти са създали програми, които ви позволяват да премахвате водни знаци от pdf файлове, например „PDF Logo Remover“, „PDF Watermark Remover“, „Nitro Pro“, „PDF Converter Ultimate", "VeryPDF PDF Text Replacer", "VeryPDF PDF към всеки конвертор" и др. И, както се казва, дори самият "Adobe Acrobat Pro" също ви позволява да направите това. След като опитах всичко споменато по-горе, ще кажа: „Те не премахват този надпис PREVIEW от файловете, издадени от ProQuest!“.

ATпринцип, задача унищожаване"воден знак" на страниците на pdf файлове за дипломирани студенти не е напълно уместен. Защото кой трябва само да хване същностот многостраничните творения на Adobe и още повече когато воден знакне пречи на директното разкъсване на текста „оттам“, този проблем е „на барабана“.

ОЖивотът обаче е много по-сложен и разнообразен от ежедневието на аспирантите, така че аз лично имах задачата повече от веднъж яснонякакъв pdf-файл от ненужни надписи, като "PREVIEW", "COPYRIGHT", "DTIC", "IEEE Proof" и други подобни. Между другото, не за целта крадатили да си присвои чужд интелектуален продукт, не дай Боже, но по съвсем други причини.

T Така че, веднъж изправен пред такъв проблем, наистина изпробвах доста софтуерни продукти. В някои случаи работиедин, в други други, но много по-често "патентованите лекари" се оказват безсилни. И "какво" да правя?

НО какво, например, правят умни и сръчни мъже без пари по селата, когато трябва да се движат из местните дупки? Те, използвайки импровизирани средства, остатъци от съветско колхозно оборудване, стари гуми, парчета метален скрап в двора, плюс заваръчна машина на съседа, просто си правят някакъв самоходен агрегат. Той, разбира се, болезнено грозен на външен вид, но, ето го в люлка, - КЪСМЕТ! Имате ли нужда от пулове или отидете?

П тъй като отдавна съм свикнал да правя много неща в командния ред под формата на скриптове или пакетни файлове 1) Този подход прави живота много по-лесен при автоматизиране на различни рутинни операции, които имам насипно по време на работа, или при обработка на големи количества данни. В този случай всичко е под контрол. Освен това, като напишете няколко дузини реда и натиснете бутон, можете да отидете във всичките четири посоки - дори да пушите, дори да дрямете!, то в този случай "без черупки" и грозен « воден знак терминатор» pdf-файлове аз "ослепих" за лични нужди от това, което беше. Ми добре! Написването на пълноценна графична обвивка и дори с нов модерен, стил на надгробна плоча, интерфейсът на Windows беше „за скрап“. Не се преобличаш за вечеря, нали? И можете да ядете на масата по бельо.

Алгоритъм за действие

AT В повечето случаи водният знак в pdf файлове е някакъв надпис или текстовикартина на заден план perосновен текст. Освен това за изображението му в pdf-документи с научно-техническисъдържанието обикновено използва определен нюанс на сивото - не петдесет, както е модерно сега, а един. Параноичен калъф за воден знак с многоцветно запълване, градиент, падащи сенки и други дизайнерски функции звънци и свиркиняма да бъдат разгледани. В «вчених»това е малко по-бързо. Така че накратко алгоритъмсамостоятелно направеното "прекратяване" на нежеланото маркиране е както следва:

И Така че, нека разгледаме по-подробно описания по-горе алгоритъм.

П Да кажем, че имаме pdf файл с някаква глупост сивонадпис на заден план. Освен това, нека усложним въвеждането: нека файла освен това защитениот промени.

AT от вас жив пример за такъв файл е моята статия в списанието « Геонаука и дистанционно наблюдение» който ми беше изпратен оттампрез 2004 г. за окончателна ревизия. Като отворите този файл в "Adobe Acrobat pro" и натиснете "Ctrl-D", можете да видите в "Свойства на документа" в секцията "Защита", че този pdf файл е забранен промяна, оформление, копиранеи извличане на страници.

1. Премахнете ограниченията

T Така първата стъпка е премахването на установената защита или ограничения. Един от методите на това недружелюбно действие беше описан от мен в "Трик номер 6 - Отваряне на защитен с парола pdf файл". Там, честно казано, за това беше използвана добра програма от Wondershare - PDF Splitter 1.5, взета, както винаги, от буржоазите за временно ползване.

Х о, за съжаление, "PDF Splitter 1.5" не ви позволява да работите от командния ред 2) Всъщност, за да използвам програми без поддръжка на командния ред в скриптове, разработих определена техника - може би не много елегантна, но работеща. Някак си ще го опиша в следващия "Трик".. Затова трябваше да търся алтернатива, която беше намерена в лицето на безплатната полезност " qpdf » 3) Връзка към " ", връзка към мястото, където можете да изтеглите тази помощна програма., което позволява в един ред

qpdf - декриптиране на вход.pdf изход.pdf

премахване на ограничения от pdf файл 4) По време на работа се използват следните файлове: “qpdf.exe”, “libgcc_s_dw2-1.dll”, “libstdc++-6.dll”, “qpdf13.dll”. Връзка към източника,.. Просто и с вкус.

О Разбира се, не бива да се правят илюзии относно "qpdf". Какво може би, тя прави и това, което не може, тогава " Е, не можах».

2. Разбийте на парчета

П отиде по-далеч. За разделяне („разделяне“) и сливане („сливане“) на pdf файлове се натрупва скапан облак от програми: различни обеми и с различни възможности 5) Например "A-PDF сливане 2.4", „Безплатно PDF сливане (Разделител)“, "PDF Content Split" , "PDF Splitter and Merger" , "PDF Stitcher 2.0" , "Wondershare PDF merger-splitter", "TPDF" и т.н. и т.н.. Но винаги ми е било по-познато и по-удобно да бъркам команден файл, да напиша няколко реда там и да не се притеснявам.

Х например файлът "input.pdf" с вдигна ограничениятаможете да „дразните“ на отделни страници с миг на око, като използвате помощни програми "pdftk", "tpdf", или " ", като се изпълни само на командния ред

pdftk input.pdf пакет

tpdf -t split -in input.pdf -out out_.pdf -ns —

или

cpdf -разделен вход.pdf -o pg_%%%%%%%.pdf 6) Този ред трябва да бъде записан в bat файла и пакетният файл трябва да бъде стартиран.

П След първата и третата команди в текущата папка ще се появят куп файлове като "pg_0001.pdf", "pg_0002.pdf", ..., а след втората - "out_001.pdf", "out_002.pdf" , ...

3. Преобразувайте pdf в tif

д За тази операция те измислиха и много повече специални красиви програми и онлайн услуги. Но аз използвам набор от софтуер за такива цели. "ghostscript"(вижте кратка информация). Днес има версия 9.18, която може да бъде изтеглена от тук и инсталирана „без пари“ - ако желаете, разбира се. Преносима версия на Ghostscript за стар и нов Windows (необходима за този случай) може да бъде изтеглена от тук.

AT from е пример за едноредова команда в bat файл, който преобразува файла "input.pdf" в "output.tif".

gswin32.exe -dNOPAUSE -dQUIET -dNOPROMPT -sDEVICE=tiffgray -sCompression=lzw -r300x300 -dNOPAUSE -sOutputFile=output.tif input.pdf -c quit

4. Извлечете водния знак

Е това е единственият момент на човешка намеса в автоматичния процес на магическото изчезване на водния знак. Първоначално исках да използвам "Paint Shop Pro 6.02", който използвам през цялото време, въпреки 15-годишната възраст на този софтуер. « Старите хора - стари неща » . Тъй като тази версия е лека като птица, бърза и интуитивна. За разлика от сегашния си потомък – последната версия на X8 – раздуто чудовище с разпределение от около 250 MB със страхотни функции, които са 99% ненужни за рутинната ми работа. Въпреки че тенденцията е очевидна. Вместо „Windows 3.11 за работни групи“ на три дискети и 640 килобайта памет, сега всяко парче желязо, дори и най-малкото, работи с гигабайти и десетки гигабайта.

Х о, тогава се сетих за друга прекрасна програма - Irfan View, който е в моя кръг от "избрани" и "незаменими" (в момента имам версия 4.37). Използването му заедно с помощните програми clipin и cmp (от прекрасния комплект от 135 помощни програми Пуф! ») направи възможно възможно най-много автоматизиране на етапа на избор на фрагмент с воден знак.

Р интелигентно същество, например завършил студент, трябваше само да избере с мишката във файла, който се отвори в IrfanView, „парче“ от действителния воден знак, да натисне световноизвестната комбинация „Ctrl-C“ и да затвори IrfanView.

Х и това е твое изпълнимомисията приключва, след което можете да се „възстановите и да пушите“.

5. Определете цветния код на водния знак

д Тази операция се извършва с помощта на помощната програма "идентифицирам"от елегантния софтуерен пакет ImageMagick 7) Връзка към началната страница, местоположение за изтегляне за текущата версия 6.9.2-4 и преносимите версии, които използвам.. ImageMagick е толкова мощен, че може всичко. За да направите това, имате нужда от едно-единствено малко нещо - с него имате нужда разбирам. Но точно като MiKTeX 8) Куп мои връзки: , връзка 2 , връзка 3 , връзка 4 , връзка 5 , връзка 6 , връзка 7 .според Михал Михалич 9) ММ Жванецки: " Е, Швейцария е много малка страна. Красноярският край я покрива, както бик покрива овца" (връзка)"покрива" Word и дори морето от всякакъв софтуер за публикуване, както "бик овца", а ImageMagick отваря безкрайно море от възможности за тези, които искат да направят "бонбони" от изображения.

О с единствената команда на формата

идентифициране -подробен input.tif >info.txt

Помощната програма "идентификация" "разделя" входния файл "input.tif" по начин, който екип от следователи не може да направи след 10-часов разпит. И от неговото „свидетелство“ (файл „info.txt“) можете да извадите всичко, от което се нуждаете, включително нашите скромни нужди от цветен код на воден знак.

6. Воден знак "Изпълнение".

Х и последният етап, за който започна цялата тази суматоха, влиза в игра друга помощна програма ImageMagick със скромно име "конвертиране". След като определихме на предишния етап цветния код на водния знак, който ни пречи, например във формата #D9D9D9, с кратка команда

конвертиране input.tif -fill white -opaque #D9D9D9 output.tif

напълно сменяме товацвят в изходния файл "input.tif" към цвета на фона на страницата ("white"), записвайки резултата в "output.tif". Сега остава само да превърнете tif обратно в pdf и това ще бъде голяма и смела точка.

7. Върнете се към "произхода"

П Тъй като всичко вече е измислено преди нас, умните глави на планетата са „планирали“ много програми и помощни програми за конвертиране на изображения в pdf формат. Лично аз определено съм пробвал дузина различни „ръкоделие“ плюс онлайн услуги. Но за тази задача използвах помощната програма Tiff2Pdf и библиотеката BitMiracle.LibTiff.NET.dll от пакета "LibTiff.Net"като изтеглите архива от връзката. С използването му панталоните се превръщат в елегантни шорти с едно движение на китката»:

Tiff2Pdf -z -o изход.pdf вход.tif

8. PDF на всички страни, обединете се!

П Върху „не искам“. Но винаги ми е било интересно да знам за какво са необходими куп програми, ако вече има прекрасен инструментариум, който вече е споменат "pdftk". Така че, за да комбинирате цяла компания от pdf файлове в папката „pdfs“ в един общ файл „pdf_out.pdf“, достатъчно е просто да въведете в командния ред

pdftk pdfs\*.pdf котка изход pdf_out.pdf

Послеслов

Е ако някой не е заспал, стигайки до тези редове, тогава, надявам се, е успял да стигне общидея за алгоритъма за премахване на водни знаци от pdf файл.

Да се Между другото, досега някои другари, получавайки правителствена награда, завършват речта си с думите: „ Но това не е само моя заслуга, а заслуга на целия ни екип!". Описване почти всичкипомощни програми, които бяха използвани за решаване на този проблем, не мога да не спомена че, без който не бих могъл да направя нищо: стрийминг текстов редактор sed 10) , където се съхранява версия 4.1.5, която използвам. на дистрибуторския комплект на текущата версия 4.2.1.. Малък и скромен работник от дома, който изковава победа над текстови орди - така бих определил тази полезност, незаменима в моята работа. Слава на sed, вдъхновителя и организатора на нашите постижения!

Кодове за любопитни

аз Разбирам, че страстта към бране на вътрешностите на играчките, като моите внуци, преминава с годините. Но за онези дипломирани студенти по технически специалности (за лекарите ще премълча), които успяха да запазят тази своя детска непосредственост, предлагам да погледнат вътрешността на това seremyazhny"воден знак-терминатор". Тук - към страницата с кодовете на всички bat-файлове. Когато ги писах, се опитах да коментирам максимално (@rem) действията си за млади студенти. Но най-вероятно нещо липсва. " Е, обади се, Никола! Няма банани за теб».

Инструкция

Х в!?! Значи да, няколкодългият преамбюл свърши! " Гоп-стоп, приближихме се отзад ъгъла».

T така че, ако искате да изтеглите това домашно приготвени, тогава го имам. - архивен файл "portable_wm-remove.zip" (за минута, 24 894 285 байта). Всеки, който не ми вярва, но по някаква причина вярва на Yandex.Disk, може да разтърси всичко това "студова", с гаранция в ръка, няма вируси. Между другото, този воден знак "терминатор" е тестван върху непознатимашини с Windows XP, 7-ма и 8-ма версии: всичко работи.

По стъпките

  1. Изтеглете архива и го разархивирайте в папка на вашия компютър.
  2. Хвърлете в тази папка pdf файл, от който искате да опитате да премахнете позора във формуляра сивоводен знак.
  3. Преименувайте този файл като "pdf_in.pdf".
  4. Bale върху пакетния файл "_clean.bat", като изчистите папките от евентуално останалите предишни резултати.
  5. Bale върху пакетния файл "1_remove-wm.bat", като стартира процеса на "унищожаване" на водния знак.
  6. Не се плашете от мигащите прозорци на Ghostscript: pdf файловете се преобразуват в tif изображения.
  7. На снимката, която се отваря в IrfanView, визуално изберете фрагмент самоводен знак без "залепване" на текста. С натискане на левия бутон на мишката с помощта на курсора с формата на кръст избираме желаната малка област от изображението. След това бутонът може да бъде освободен, позволявайки на мишката да поеме глътка въздух.
  8. Натиснете магическите клавиши "Ctrl-C" и затворете IrfanView.
  9. Всичко останало ще се оправи от само себе си. След известно време в тази папка ще се появи файл без воден знак - „pdf_out.pdf“.

Х за да потвърди, че това върши работа, предлагам да разгледаме четири примера за различни pdf файлове "ПРЕДИ" и "СЛЕД". В последния пример оригиналният файл беше защитен от ограничения за промяна на файла.

Всичко това може да се изпробва безплатно, но е необходим лиценз, за ​​да получите желания резултат.

Въпреки това, водният знак на този конкретен PDF файл (който ОП ми изпрати по имейл) не е едно изображение, което се повтаря на всички страници. Както се оказва, PDFCreator го е кодирал (почти пиксел по пиксел) във всеки от тях. Това прави много по-трудно премахването на водния знак (и води до доста раздут PDF файл).

Тъй като водният знак всъщност се състои от много малки изображения, можете да ги премахнете с PDF редактор (като Foxit Advanced PDF Editor), като просто ги изберете и щракнете върху Премахване. За съжаление трябва да повторите това за всяка страница.

По-малко отнемащо време решение би било да премахнете водния знак програмно. Имаме нужда от:

  • Pdftk: Инструмент за (де)компресиране и коригиране на PDF потоци.
  • Notepad++ : текстов редактор, способен да замени съвместими с Perl регулярни изрази.

мерки

    Изтеглете Pdftk и извлечете pdftk.exeи libiconv2.dllв %windir%\System32, директория по пътя или всяко друго местоположение по ваш избор.

    Изтеглете и инсталирайте Notepad++.

    PDF потоците обикновено се компресират с помощта на алгоритъма DEFLATE. Това спестява място, но прави PDF източника нечетлив.

    pdftk original.pdf изход некомпресиран.pdf декомпресиран

    разопакова всички потоци, за да могат да бъдат модифицирани от текстов редактор.

    отворен некомпресиран.pdfизползвайки Notepad++, за да разкриете структурата на водния знак.

    В този конкретен случай всяка страница започва с блок

    Q 9 0 0 9 2997 4118,67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q

    и почти 4000 блока като този. Този конкретен блок задава само един (/W 1 /H 1) пиксел за воден знак.

    Превъртането надолу до промяната на шаблона показва, че потокът на водния знак е с дължина 95 906 байта (като се броят нови редове). Точно същият поток се повтаря на всяка страница от PDF файла.

    Натиснете Ctrl + H и инсталирайте следното:

    Намерете: q 9 0 0 9 2997 4118\.67 cm. (95881) Заменете: (празно) Случай на съвпадение: отметка Обвиване наоколо: отметнато Регулярен израз: избран . съвпада с нов ред: отметнато

    Регулярният израз q 9 0 0 9 2997 4118\.67 cm. (95881) съответства на първия ред от горния блок (q 9 0 0 9 2997 4118.67 cm) и всички следващи 95 881 знака, т.е. потока от водния знак.

    натискане на " Сменете всички"го премахва от всички страници на PDF файла.

    Водният знак вече е премахнат, но PDF файлът има грешки (дължината на потоците е неправилна) и не е компресиран.

    pdftk uncompressed.pdf изход nowatermark.pdf компресиране

    се грижи и за двете.

    некомпресиран.pdfвече не е необходимо. Можете да го премахнете.

Резултатът е същият PDF без водния знак (и около половината от размера).

Ако ($answer_counter == 1): ?> endif; ?>

За водни знаци, базирани на изображения, има няколко инструмента, които обещават да ги премахнат автоматично. Например:

Можете да опитате всичко това, но е необходим лиценз, за ​​да получите желания резултат.

Въпреки това, водният знак на този конкретен PDF файл (който ми изпрати имейл) не е едно изображение, което се повтаря на всички страници. Както се оказва, PDFCreator го е кодирал (почти пиксел по пиксел) във всеки от тях. Това прави водния знак много по-труден за премахване (и води до доста раздут PDF).

Тъй като водният знак всъщност се състои от много малки изображения, можете да ги премахнете с PDF редактор (като Foxit Advanced PDF Editor), като просто ги изберете и щракнете върху Премахване. За съжаление трябва да повторите това за всяка страница.

По-малко отнемащо време решение би било програмното премахване на водни знаци. Имаме нужда от:

  • Pdftk: Инструмент за (де)компресиране и коригиране на PDF потоци.
  • Notepad++: текстов редактор, способен да замени поддържаните от Perl регулярни изрази.

Действия

    Изтеглете Pdftk и извлечете pdftk.exeи libiconv2.dllв %windir%\System32, директория по пътя или всяко друго местоположение по ваш избор.

    Изтеглете и инсталирайте Notepad++.

    PDF потоците обикновено се компресират с помощта на алгоритъма DEFLATE. Това спестява място, но прави PDF източника нечетлив.

    pdftk original.pdf изход некомпресиран.pdf декомпресиран

    разопакова всички потоци, за да могат да бъдат модифицирани с текстов редактор.

    отворен некомпресиран.pdfс помощта на Notepad++, за да покажете структурата на водния знак.

    В този конкретен случай всяка страница започва с блок

    Q 9 0 0 9 2997 4118,67 cm BI /CS/RGB /W 1 /H 1 /BPC 8 ID Ÿ®¼ EI Q

    и почти 4000 блока като този. Този конкретен блок задава само един (/W 1 /H 1) пиксел за воден знак.

    Превъртането надолу до промяната на шаблона показва, че потокът на водния знак е 95 906 байта (като се броят нови редове). Точният поток се повтаря на всяка страница от PDF файла.

    Натиснете Ctrl + H и инсталирайте следното:

    Намерете: q 9 0 0 9 2997 4118\.67 cm. (95881) Заменете: (празно) Случай на съвпадение: отметка Обвиване наоколо: отметнато Регулярен израз: избран . съвпада с нов ред: отметнато

    Регулярният израз q 9 0 0 9 2997 4118\.67 cm. (95881) съответства на първия ред от горния блок (q 9 0 0 9 2997 4118.67 cm) и всички следващи 95 881 знака, т.е. потока от водния знак.

    Щракване Заменете всички, премахнете го от всички страници на PDF файла.

    Сега водният знак е премахнат, но PDF файлът има грешки (дължината на потоците е неправилна) и е некомпресиран.

    pdftk uncompressed.pdf изход nowatermark.pdf компресиране

    се грижи за всички.

    некомпресиран.pdfвече не се изисква. Можете да го премахнете.

Резултатът е същият PDF без водния знак (и около половината от размера).

Воден знак е текст или изображение, поставено зад или преди съдържанието на документ. Обикновено това е информация, която идентифицира автора на документа.
За водните знаци можете да регулирате размера, шрифта, стила, цвета, местоположението на страницата, да посочите номерата на страниците, на които ще се показват и т.н., а също така да изберете изображение от PDF файл като воден знак. Водни знаци от различни видове могат да се използват в един файл. Можете да добавите няколко водни знака към всяка страница от документ.
Настройките на водния знак могат да бъдат запазени за по-късна употреба.

Добавяне на водни знаци.

За да добавите водни знаци към PDF документ, изберете от главното меню: Документ>воден знак> Добавяне

  • ПрегледЗадаване на параметрите на вмъкнатото изображение.
    Обърни се- Стойността на ъгъла на завъртане (в градуси) на водния знак спрямо страницата на документа.
    Непрозрачност- Стойност на непрозрачността (в проценти).
    Мащаботносително към целевата страница - Мащабът на водния знак по отношение на страницата на документа, върху която ще бъде добавен този знак.
  • Изходен документИзберете типа воден знак, който да се вмъкне. Това може да бъде въведен текст или изображение от PDF файл.
    ТекстКогато маркерът е зададен, изходният материал за водния знак ще бъде въведения текст.
    Шрифт- Задайте следните опции за текста на водния знак: тип шрифт, размер, цвят и подчертаване на текста с подчертаване.
  • Запазени настройкиСписък със запазени шаблони за водни знаци.
    За да добавите шаблон, посочете необходимите опции за воден знак и щракнете Запазете. В диалоговия прозорец, който се показва, запишете името на шаблона.
    За да изтриете шаблон, изберете го от списъка със запазени настройки. Потвърдете изтриването на шаблона в диалоговия прозорец, който се показва.
  • ФайлКогато маркерът е зададен, изходният материал за водния знак ще бъде изображение, заредено от PDF или графичен файл.
    Преглед- Изберете изходен PDF файл или файл с изображение за воден знак.
    Номер на страницата- Номерът на страницата на файла, чието изображение ще се използва като воден знак. (Общият брой страници във файла се показва под Общо страници)
    Мащаб- Мащабът на водния знак по отношение на оригиналното изображение, вмъкнато от PDF файла. За да направите този елемент активен, премахнете маркера в елемента Преглед> Относителен мащаб целева страница.
  • ПозицияЗадава позицията на водния знак на страницата на документа.
    Вертикално изместване- Стойността на вертикалното отместване на водния знак спрямо избраната позиция: отгоре, в центъра или отдолу.
    Хоризонтално изместване- Стойността на хоризонталното отместване на водния знак спрямо избраната позиция: отгоре, в центъра или отдолу.
    Единици- Избор на мерни единици за определяне на разстоянието на смяна.
  • Диапазон на страницитеПосочете диапазона на страниците, за да добавите водни знаци.

Премахнете всички водни знаци.

За да изтриете единични знаци, изберете от главното меню Документ>Воден знак>Изтриване.Всички единични знаци в документа ще бъдат премахнати.