Signaler

Rognage JPG sans toucher à la qualité [Résolu]

Posez votre question lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - Dernière réponse le 12 août 2017 à 18:37 par contrariness
Bonjour à tous,

Je viens de commencer la lourde tâche de scanner des photos de famille papier. J'ai scanné au format JPG, 2 photos à la fois depuis un scanner, en les séparant.

J'ai essayé 2 automatisations pour extraire les photos :
- plugin DivideScannedImages de Francois Malan : donne peu de résultats à seuil constant (je pense que c'est dû à l’hétérogénéité des ambiances de mes photos), beaucoup de faux-positifs
- script multicrop ImageMagick de Fred Weinhaus : extrait 95% de bonne images ... sans rien faire de particulier (bizarrement les photos en erreur ont subit une rotation, alors qu'elles étaient horizontales)

J'ai donc utilisé le script IM multicrop et pour extraire les photos en échec j'utilise TheGimp.

Depuis TheGimp, après export en JPG, j'ai constaté que certaines photos font plus de 1MB. Alors j'ai regardé de près les réglages :
- Qualité : 90%
- Non progressif (pas d'entrelacement)
- Sous-échantillonnage : 4-2-2 horizontal (la doc donne 2x1,1x1,1x1 - facteur identique à celui du scan origine)

Par exemple pour un scan de 1.1MB :
- IM multicrop : photo1=435KB, photo2=449KB (zooms identiques au ressenti)
- TheGimp export JPG : photo1=624KB, photo2=1,4MB (> scan origine !!!)

Je vais avoir plein de scan à traiter et j'ai besoin de régler le problème pour perdre le moins de place possible.

Depuis TheGimp, quel réglage appliquer pour avoir la même qualité que le scan d'origine sans "gonfler" inutilement le fichier exporté ?

Environnement :
- ImageMagick v6.6.9
- Gimp v2.8.20

Si quelqu'un peut m'éclairer sur le sujet, ce serait vraiment cool :)

Cordialement,
lnj




Afficher la suite 
Utile
+0
plus moins
Slt

On scanne en tif, on fait les modifs et on enregistre (une seule fois) en jpeg
lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 3 août 2017 à 09:55
Salut,

Alors j'ai pas le scanner sous la main, mais il me semble que seules les options JPEG et PDF étaient proposées.

Et puis quand bien même ça ne change pas ma question.
Répondre
lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 3 août 2017 à 16:51
Re-

Alors j'ai compris que pour faire correctement j'aurais du scanner au format TIFF qui est compressé sans pertes (lossless). Je ne savais pas que le format TIFF servait à ça mais je ne suis pas sûr que le multi-fonctions RICOH le permettait.

Je souhaiterais savoir si je comprends bien ce qui se passe dans la chaîne de traitement.

D'après ce que l'outil identify de IM a renvoyé (voir la réponse que j'ai fait à contrariness), le scanner m'a produit des fichiers compressés à 51% (=> pertes = 51% ?) et comme j'exporte de TheGimp avec un niveau de compression de 90% (valeur par défaut), les fichiers sont énormes.

Si je comprends bien :
- le scanner a capté et créé une image brute et l'a convertit en JPG avec une qualité de 51% (donc il y a beaucoup de pertes - le format JPEG n'étant pas lossless)
- quand j'ouvre l'image, il décompresse l'image à 51%, on retrouve une image de taille analogue à l'image brute créée par le scanner (une sorte d'image bitmap me semble t-il), mais bien évidemment sans tous les détails de l'image brute initiale (ce que la compression a perdu)
- je fait mon rognage et je veux exporter, dans le meilleur des cas je conserve le même niveau de détails lors de l'enregistrement, mais je pense que le fait de recompresser à 51% donne "approximativement" le même niveau de détail que celui produit par le scanner (en gros on n'a pas "trop" de pertes en plus que lors de la 1ère compression), par contre il est inutile de compresser à plus de 51% du coup

Ce serait ça ?
Répondre
Donnez votre avis
Utile
+0
plus moins
En compression JPG, ce n'est pas trop la taille de la photo qui infuence le poids, mais son contenu.. (mis a part le taux de compression bien sur)

Plus une image possede de zones de couleur differentes, plus le poids sera important (pour une meme taille d'image).

Dans l'export depuis Gimp, avez vous fait une annulation apres avoir isole la premiere image pour faire la seconde, ou etes vous reparti de l'image de base pour la recouper ??

Scanner plusieurs images en meme temps, c'est effectivement plus rapide, mais c'est au detriment de la qualite. Le scanner va faire une moyenne des couleurs ce qui peut en favoriser certaines au detriment d'autres... (a moins de pouvoir desactiver les automatismes..et avoir un mode manuel neutre)
lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 3 août 2017 à 11:53
Bonjour,

Dans l'export j'ai fait : 1) ouvrir l'image, 2) délimiter la 1ère photo avec une sélection, 3) copier, 4) Coller comme nouvelle image, 5) Export JPG de cette nouvelle image, 6) fermer l'image, 7) délimiter la 2ème photo, ... mais je ne suis pas passé par Annuler. Pour quoi faire ???

Effectivement j'ai conscience que ce n'est pas une bonne idée de scanner 2 par 2, mais j'étais pris par le temps et ça m'a simplifié les manœuvres. De plus j'ai pris une résolution de scan à 600x600 px, ce qui donne un niveau de détail acceptable (en tout cas pour mes yeux à moi).

De plus, comme me l'a souligné kaumune, je n'ai, à priori, pas appliqué la bonne méthode pour être propre (TIFF ->....-> JPG). Je n'ai pas le modèle exact du scanner en tête (un multi-fonctions RICOH) mais à priori en regardant différents modèles sur le net, les spécifications indiquent que les formats PDF, JPG et TIFF sont pris en charge. Donc j'essayerais d'appliquer pour les prochains scans.

Ce que je ne comprends pas c'est que IM ne gonfle pas les fichiers JPG "croppés" comme le fait TheGimp. D'où mon interrogation...


[edit]je voulais dire la résolution de scan 600x600 ppp[/edit]
Répondre
contrariness 10946Messages postés samedi 10 juillet 2010Date d'inscription 16 août 2017 Dernière intervention - 3 août 2017 à 11:57
je me demande si il n'y aurait pas un bug dans Gimp qui garde le cache de la premiere image en l'ajoutant lors du 2e copier/coller..

Essayez en fermant l'image de base avant de faire la manip.

Je n'utilise pas Gimp, mais ne peut-on pas rogner l'image avant de l'enregistrer au lieu de faire un copier/coller d'une selection ?

Autre chose.. verifiez que vos 2 images pratiquement de la meme taille sont bien dans la meme resolution.
Répondre
lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 3 août 2017 à 14:29
J'ai essayé en fermant l'image (en créant un fichier projet avec des guides pour avoir les mêmes bases), en utilisant l'outil rogner puis l'outil sélection/copier/coller => les exports sont à peu près de la même taille que ceux que j'obtenais avec ma méthode du début

Je ne pense pas qu'il y ait de bug comme ça ; j'opterais plus pour ma méconnaissance du logiciel.

Là sur un exemple concret :
Mon scan fait 1.2MB, le script IM multicrop extrait 2 photos P1: 543KB et P2: 492KB, mais P2 n'étant pas droite, j'ouvre le scan, rogne et exporte (qualité : 90% je rappelle) => P2': 1.3MB (soit environ 3xP2)

=> P1+P2 ~= 1.2MB mais P2' ~= 3xP2 => WTF !!!!

En regardant l'aide de multicrop il n'y a pas de notion de qualité => IM sait rogner sans toucher à la qualité mais TheGimp ???

-----

Je ne comprends pas la dernière remarque :

Autre chose.. verifiez que vos 2 images pratiquement de la meme taille sont bien dans la meme resolution.

Les copier/coller dans TheGimp ne changent pas la résolution.
Les photos sur chaque scan ont la même résolution 600x600 ppp (réglage global) mais n'ont pas forcément les mêmes dimensions (lxh) .

Pourriez-vous préciser de quelles images vous parlez (je commence à avoir du yaourt à la place du cerveau :) ) ?
Répondre
Donnez votre avis
Utile
+0
plus moins
Je ne connais pas Gimp, mais si je compare a Photoshop, le Copier/Coller dans un nouveau document prend la resolution et la taille de l'image dans le press-papier. Par contre le coller dans un document deja ouvert, prend la resolution de celui-ci (qui peut etre differente de celle que l'on colle).

Si une image modifiee dans Gimp prend du poids apres modification c'est qu'il y a un ou des parametres qui modifie l'image..

Dans les parametres vous avez la resolution, la compression, le nombre de bit par couleur et l'espace colorimetrique...

Ouvrez vos 2 images, celle issue du script et celle apres modif dans Gimp et regardez les informations sur l'image.. il doit y avoir surement des differences
lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 3 août 2017 à 16:33
Je l'avais fait depuis TheGimp mais je n'ai rien vu de bien probant.

Du coup, j'ai recherché et j'ai trouvé l'outil identify de IM pour obtenir plus d'infos sur une image (identify -verbose). Voici le résultat ici du diff entre les infos du rognage automatique par script et celles de l'export de TheGimp.

A la fin :
<   Quality: 51
---
> Quality: 90

indique que la photo rognée par script aurait une qualité de 51% et que celle exportée de TheGimp aurait bien la qualité que je lui ai donné au moment de l'export à savoir 90%.

En creusant un peu, j'ai remarqué que les infos du scan indiquent bien une qualité de 51% aussi. Ceci voudrait dire que le scanner produirait des scans JPG avec une qualité de 51% (ce qui me semble très faible).

J'ai donc testé un export de la photo avec une qualité de 51. L'image fait 505KB

J'ai comparé un zoom de la photo sur le scan à un zoom de celle exportée ; il semblerait qu'ils sont sensiblement identiques, en tout cas au ressenti.

Toutefois dans la doc TheGimp est indiqué que ce facteur de compression ne signifie pas forcément la même chose entre une application et une autre.

Donc là ça me semble un peu plus pertinent déjà !
Répondre
Donnez votre avis
Utile
+0
plus moins
Dans la compression d'un JPG il y a 2 parametres qui jouent sur le fichier lui meme.
- Le taux de compression (qui influe sur la qualite de l'image)
- Le rapport de compression qui est le % obtenu en fonction des donnees contenues dans l'image. Si par ex. vous avez une image composee d'un rectangle noir dans une surface blanche, vous pourriez avoir un rapport pouvant atteindre 2 ou 3% de la taille original du fichier de base... Car la compression se fera que sur 2 couleurs et non pas sur un ensemble de nuances de gris ou de couleurs..
lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 3 août 2017 à 18:27
J'avais plus ou moins compris ça.

En tout cas exporter en JPG depuis TheGimp avec la qualité 51% (révélé par l'outil identify de IM) donne approximativement les mêmes fichiers que ceux qui ont été produits par le script multicrop de IM.
Répondre
Luke1 18983Messages postés mercredi 14 novembre 2007Date d'inscription ContributeurStatut 16 août 2017 Dernière intervention - 3 août 2017 à 23:26
Bonsoir Contrariness,
Je ne connais pas Gimp, mais si je compare a Photoshop, le Copier/Coller dans un nouveau document prend la resolution et la taille de l'image dans le press-papier. Par contre le coller dans un document deja ouvert, prend la resolution de celui-ci (qui peut etre differente de celle que l'on colle). 

Ta comparaison est bonne les deux marchent de la même façon, en tt cas à ce niveau...

Bonne fin de soirée et bonne journée. ;)

Luke.
Répondre
Donnez votre avis
Utile
+0
plus moins
Donc le problème est résolu !

Merci à kaumune et contrariness pour votre aide ;)

La méthode à préférer est comme l'indique kaumune :
- si c'est possible, scanner au format TIFF (format lourd, sans pertes)
- faire toutes les modifications nécessaires
- exporter au format JPEG (plus léger, avec pertes)

Pour ceux qui ont fait l'erreur comme moi de scanner au format JPEG, voici
ce qu'il se passe si j'ai bien compris (le dessin est une création originale et personnelle).



Attention :
1) ce n'est qu'une vue TRES simplifiée
2) je ne suis pas expert sur le sujet (loin de là), c'est comme ça que je l'ai perçu à travers plusieurs lectures et que je le conçois, mais je peux avoir faux ! Donc ne prenez pas ceci comme "argent comptant", restez vigilants et critiques !

La question est donc de connaître la qualité que la scanner a utilisé pour produire le fichier JPEG.

On peut l'obtenir grâce à la commande identify de ImageMagick (logiciel libre). Voici la commande identify (sous linux) :
$ identify -verbose mon_scan.jpg | grep Quality

=> Quality: 51

Sous TheGimp pour exporter en JPEG, il y a 3 réglages à appliquer pour perdre le moins d'informations possibles : la qualité, si l'affichage de l'image est entrelacé = progressif (accélère le chargement des images dans une page web) et le sous-échantillonnage. Voici la fenêtre export JPEG pour TheGimp v2.8.20) :



On peut obtenir ces réglages grâce à la commande identify, :
$ identify -verbose mon_scan.jpg | egrep "Interlace:|Quality:|jpeg:sampling-factor:"

=> Interlace: None
=> Quality: 51
=> jpeg:sampling-factor: 2x1,1x1,1x1

Nota1 : dans la doc TheGimp il est précisé que la qualité est un facteur qui n'est pas identique d'un logiciel à un autre

Nota2 : toujours dans la doc 2x1,1x1,1x1 est présenté soit sous la forme 4:2:2 horizontal, soit 4:2:2 vertical ; j'ai testé horizontal et ça me va bien

Au final, on obtient une image d'une taille de fichier en rapport avec celle du scan d'origine.

Ma petite expérience récente m'a montré que cette méthode produisait des résultats acceptables (en tout cas pour moi). A vous de voir si ça vous convient !

Voili, voilou :)

lenainjaune 382Messages postés mercredi 7 mai 2008Date d'inscription ContributeurStatut 12 août 2017 Dernière intervention - 12 août 2017 à 17:33
J'ai pu avoir à nouveau accès au scanner.

Bien souvent le format TIFF n'est possible que pour les images en noir et blanc. Malheureusement c'est le cas pour ce scanner (RICOH SP C250SF). La documentation est claire sur le sujet (http://support.ricoh.com/bb_v1oi/html/oi/re/model/spc250sf/spc250sfen.htm)

Donc dans tout les cas j'ai pris la meilleur qualité que pouvait délivrer cet appareil (JPEG 600x600 ppp).
Répondre
Donnez votre avis
Utile
+0
plus moins
Vous passez par le pilote Twain pour scanner vos documents ?
Dans ce cas, vous devez avoir le choix de la resolution et du format d'enregistrement...
Donnez votre avis

Les membres obtiennent plus de réponses que les utilisateurs anonymes.

Le fait d'être membre vous permet d'avoir un suivi détaillé de vos demandes.

Le fait d'être membre vous permet d'avoir des options supplémentaires.

Vous n'êtes pas encore membre ?

inscrivez-vous, c'est gratuit et ça prend moins d'une minute !