Comment VRAIMENT protéger un PDF contre la copie du contenu ? [Fermé]

Messages postés
4
Date d'inscription
samedi 21 mars 2015
Statut
Membre
Dernière intervention
21 mars 2015
-
Bonjour,

après plusieurs essais infructueux je me tourne vers ce forum où j'espère trouver une solution à mon problème. Voilà je souhaite générer un PDF qui soit protégé contre la copie (le copier/coller du texte contenu dans le PDF). Je sais qu'il est possible de générer un PDF avec cette option, je l'ai donc fait avec :

- PDF Creator
- Le module de création de PDF de LibreOffice
- Adobe Acrobat XI Pro

Dans tous les cas, un PDF est bien généré avec une protection, et effectivement quand je lis le fichier localement, je ne peux pas copier le texte (je l'ai ouvert avec Adobe Reader, et Foxit Reader). Mais ensuite je me suis rendu compte que cette protection est totalement ridicule, car si j'upload le fichier sur un serveur FTP par exemple, et qu'ensuite je l'affiche directement dans mon navigateur (Firefox) je peux tout à fait effectuer un copier/coller du texte, si je décide de le télécharger et de l'ouvrir à nouveau avec Adobe Reader ou Foxit Reader, la protection joue bien son rôle et je ne peux pas copier.

Testez vous-même si vous le souhaitez : http://yopadato.free.fr/ppp.pdf

Quel est intérêt de ces protections si un simple navigateur comme firefox peut passer outre ? Est-ce qu'il existe un moyen de vraiment protéger un fichier PDF contre le copie ? Sans passer par un système de DRM bien sûr.

Par exemple, il m'est arrivé de tomber sur des fichiers PDF qui à première vue autorisent la copie, mais ensuite on colle ça dans n'importe quel outil de traitement de texte, on se retrouve avec un truc totalement illisible, une suite de caractères sans aucun sens. Comment réaliser la même chose ?

Merci pour votre aide
Afficher la suite 

2 réponses

0
Merci
Bonjour,
Quoi qu'il en soit, dès le moment où l'on peut visualiser le PDF sur l'écran et quelle que soit la protection utilisée, il suffit d'utiliser l'outil Capture pour en faire un JPG que l'on imprime puis que l'on passe à l'OCR. Il y aura probablement quelques corrections à faire.
Pour quelques pages, c'est jouable mais au-delà, il faut vraiment être "motivé".
Il reste peut-être un moyen de compliquer la tâche : reprendre le PDF sur Photoshop, y intégrer une trame et de sauvegarder le tout en JPG. La mention "copie interdite" peut compléter l'ensemble.
La ressource de la saisie manuelle resterait alors, qui sait, l'ultime moyen de "copier" un PDF.
Messages postés
14438
Date d'inscription
samedi 10 juillet 2010
Statut
Membre
Dernière intervention
12 décembre 2019
3190
-1
Merci
Pour eviter le copier/coller, les 2 methodes classiques sont la vectorisation du texte, et le recodage du texte.

La vectorisation empeche le copier/coller car les caracteres sont des objets vectoriels independant les uns des autres.
Le recodage du texte consiste a changer la table des caracteres en incoporant dans le PDF une autre table propre a lui-meme. Cette table etant differente de celle de Windows ou Apple, a la copie on a des caracteres illisibles. (Sorry, je n'ai pas d'info sur la maniere de proceder).

Cependant dans les 2 cas, rien n'empeche de faire de l'OCR apres avoir imprime le document PDF....c'est juste plus long.
yopadato
Messages postés
4
Date d'inscription
samedi 21 mars 2015
Statut
Membre
Dernière intervention
21 mars 2015
> @nnie
Messages postés
2156
Date d'inscription
vendredi 16 mai 2008
Statut
Membre
Dernière intervention
9 décembre 2019
-
Oui mais la personne qui veut pomper le texte sera probablement freinée par le fait de retaper entièrement une thèse de doctorat de 400 pages, ligne par ligne. Encore une fois, je sais que dans certains des fichiers PDF que j'ai téléchargés, la copie est rendue très difficile, car lorsqu'on colle ça, on obtient une suite de caractères totalement illisibles, et c'est ce que je souhaite obtenir. De plus j'ai testé plusieurs OCR sur ces fichiers, avec les soft les plus utilisés et les mieux notés, et les résultats ne sont pas fameux, pas du tout même. Donc il y a bien moyen de faire quelque chose, les personnes qui ont produit ces PDF ne sont pas magiciens. Seulement, je ne sais pas quels outils ont été utilisés.
@nnie
Messages postés
2156
Date d'inscription
vendredi 16 mai 2008
Statut
Membre
Dernière intervention
9 décembre 2019
357 -
Je serais curieuse d'avoir un exemple de ces fameux fichiers qui résistent aux meilleurs OCR ! Tu en as un ?
yopadato
Messages postés
4
Date d'inscription
samedi 21 mars 2015
Statut
Membre
Dernière intervention
21 mars 2015
-
Oui j'en ai, au moins deux, dès que je rentre je les upload et je poste le lien.
@nnie
Messages postés
2156
Date d'inscription
vendredi 16 mai 2008
Statut
Membre
Dernière intervention
9 décembre 2019
357 -
OK, merci ! ça m'intrigue carrément. ;-)
contrariness
Messages postés
14438
Date d'inscription
samedi 10 juillet 2010
Statut
Membre
Dernière intervention
12 décembre 2019
3190 -
oui moi aussi..
L'OCR ca se configure.. pour que ca marche, il faut que le texte soit de bonne qualite, mais aussi de posseder la bibliotheque de la langue a reconnaitre..