Sådan får du vist og redigeret metadata i Ubuntu

Se og rediger metadata i Linux

Ud over indholdet indeholder de filer, vi opretter eller ser på vores computer, information. kendt som metadata. I dette indlæg vil vi se på, hvordan man ser og redigerer metadata i Ubuntu.

Metadataenes funktion er at beskrive, organisere og give kontekst til en fil, så den er lettere at forstå, søge i, klassificere og analysere.

Hvad er metadata til?

Funktioner af metadata

  • søgning: Filoversigten bruger metadata til at vise den i alfabetisk rækkefølge, filtype, oprettelses- eller ændringsdato.
  • organisation: Metadata letter organisering af store mængder information.
  • Forståelse:  De hjælper automatiserede systemer såsom kunstig intelligens-modeller, søgemaskiner eller biblioteker med bedre at forstå indholdet.

Typer af metadata

Vi kan opdele dem i tre klasser:

  • Beskrivende: Data, der identificerer dokumentet, såsom titel, forfatter, beskrivelse og nøgleord.
  • Strukturel: Hvordan dokumentet er struktureret: Titler, undertekster, kapitler, format.
  • Administrativt personale: Tilladelser, oprettelsesdato, størrelse, format.

Sådan får du vist og redigeret metadata i Ubuntu

Der findes adskillige grafiske værktøjer til redigering af metadata, men i dette indlæg vil vi kun fokusere på dem, der bruger terminalen.

PDF

PDF-dokumenter har følgende formater:

  • Kvalifikation.
  • Forfatter.
  • Emne.
  • Nøgleord.
  • Oprettelsesdato
  • Ændringsdato.
  • Generatormotor.
  • Software brugt til oprettelse.
  • Beskyttelse og tilladelser.

Der findes et andet format kaldet XMP, der også indeholder disse oplysninger:

  • Oplysninger om ophavsret.
  • Miniaturer.
  • Dokumentsprog.
  • Brugerdefinerede etiketter.

Der er to nyttige kommandoer til at se metadata i Ubuntu:

Pdfinfo

Installeres med:

sudo apt install poppler-utils

bruge:

pdfinfo nombre_archivo.pdf

PDF-metadata

Eksempel på PDFINFO-kommandoen

Exiftværktøj

Med dette værktøj kan vi se metadataene i XMP-format.

Installeres med:

sudo apt install libimage-exiftool-perl

Brug

exiftool nombre_archivo.pdf

Eksempel på metadata i XMP-format

Eksempel på brug af Exiftool-programmet

For at redigere metadata bruger vi kommandoen
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
I vores eksempel, hvis vi vil oversætte titlen:

exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf

Titelmetadata ændret med Exiftool

Exiftool-kommandoen kan ændre metadata

Vi kan slette alle metadata med:

exiftool -all= nombre_archivo.pdf

Hvis vi fortryder sletningen, opretter kommandoen en kopi af PDF-filen og tilføjer præciseringen "original" til navnet.

docx

Words native format indeholder dokumentmetadata og programmetadata.

Dokumentmetadataene omfatter:

  • Kvalifikation.
  • Forfatter.
  • Den sidste person, der ændrede det.
  • Antal revisioner.
  • Oprettelsesdato.
  • Sidst ændret dato.T
  • Emne.
  • Nøgleord.
  • Kategori.
  • Kategori
  • Status (Udkast, endelig).

Applikationsmetadata

  • Skabelon
  • Software brugt.
  • Samlet antal sider.
  • Antal ord.
  • Antal tegn.
  • Antal linjer.
  • Antal afsnit.
  • Skaleringsindstillinger.
  • Organisation.
  • Navn på teamlederen.

Exiftværktøj

Kommandoen Exiftværktøj Det kan også bruges til at se metadataene i et Word-dokument.

Brug

exiftool nombre_archivo.docx

Se metadata for et Word-dokument

Kommandoen exiftool kan også bruges til at se metadata fra et Word-dokument.

En anden måde at se metadataene på er ved at ændre filtypendelsen til zip-format. Af sikkerhedsmæssige årsager gør vi dette med en kopi.

cp nombre_archivo.docx copia_archivo.zip

Vi pakker filen ud og åbner den mappe, vi har brug for

unzip copia_archivo.zip -d docxinfo

Vi læser dataene fra filerne

cat docxinfo/docProps/core.xml

For dokumentmetadata

cat docxinfo/docProps/apdp.xml

For applikationsmetadata

cat docxinfo/docProps/app.xml

Begge bruger exiftool Vi kan manuelt redigere metadataene. Igen er proceduren med exiftool den samme, som vi gjorde med PDF-filerne.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Vi kan gøre det samme manuelt på følgende måde:

Vi laver en sikkerhedskopi

cp nombre_archivo.docx copia_archivo.zip

Vi pakkede den ud i en mappe kaldet metadata.

unzip copia_archivo.zip -d metadatos

Lad os gå til mappen

cd metadatos

Vi åbner editoren

nano docProps/core.xml
for dokumentmetadata

nano docProps/apdp.xml for applikationsmetadata
Vi pakker filen om som en docx

zip -r ../nombre_archivo2.docx *
Kommandoen opretter det nye dokument uden for mappen. metadatos.