Ud over indholdet indeholder de filer, vi opretter eller ser på vores computer, information. kendt som metadata. I dette indlæg vil vi se på, hvordan man ser og redigerer metadata i Ubuntu.
Metadataenes funktion er at beskrive, organisere og give kontekst til en fil, så den er lettere at forstå, søge i, klassificere og analysere.
Hvad er metadata til?
Funktioner af metadata
- søgning: Filoversigten bruger metadata til at vise den i alfabetisk rækkefølge, filtype, oprettelses- eller ændringsdato.
- organisation: Metadata letter organisering af store mængder information.
- Forståelse: De hjælper automatiserede systemer såsom kunstig intelligens-modeller, søgemaskiner eller biblioteker med bedre at forstå indholdet.
Typer af metadata
Vi kan opdele dem i tre klasser:
- Beskrivende: Data, der identificerer dokumentet, såsom titel, forfatter, beskrivelse og nøgleord.
- Strukturel: Hvordan dokumentet er struktureret: Titler, undertekster, kapitler, format.
- Administrativt personale: Tilladelser, oprettelsesdato, størrelse, format.
Sådan får du vist og redigeret metadata i Ubuntu
Der findes adskillige grafiske værktøjer til redigering af metadata, men i dette indlæg vil vi kun fokusere på dem, der bruger terminalen.
PDF-dokumenter har følgende formater:
- Kvalifikation.
- Forfatter.
- Emne.
- Nøgleord.
- Oprettelsesdato
- Ændringsdato.
- Generatormotor.
- Software brugt til oprettelse.
- Beskyttelse og tilladelser.
Der findes et andet format kaldet XMP, der også indeholder disse oplysninger:
- Oplysninger om ophavsret.
- Miniaturer.
- Dokumentsprog.
- Brugerdefinerede etiketter.
Der er to nyttige kommandoer til at se metadata i Ubuntu:
Pdfinfo
Installeres med:
sudo apt install poppler-utils
bruge:
pdfinfo nombre_archivo.pdf
Exiftværktøj
Med dette værktøj kan vi se metadataene i XMP-format.
Installeres med:
sudo apt install libimage-exiftool-perl
Brug
exiftool nombre_archivo.pdf
For at redigere metadata bruger vi kommandoen
exiftool -parámetro "nuevo contenido del parámetro"nombre _archivo.pdf
I vores eksempel, hvis vi vil oversætte titlen:
exiftool -Title="Introducción a la programación en Python" Introduction_to_Python_Programming_-_WEB.pdf
Vi kan slette alle metadata med:
exiftool -all= nombre_archivo.pdf
Hvis vi fortryder sletningen, opretter kommandoen en kopi af PDF-filen og tilføjer præciseringen "original" til navnet.
docx
Words native format indeholder dokumentmetadata og programmetadata.
Dokumentmetadataene omfatter:
- Kvalifikation.
- Forfatter.
- Den sidste person, der ændrede det.
- Antal revisioner.
- Oprettelsesdato.
- Sidst ændret dato.T
- Emne.
- Nøgleord.
- Kategori.
- Kategori
- Status (Udkast, endelig).
Applikationsmetadata
- Skabelon
- Software brugt.
- Samlet antal sider.
- Antal ord.
- Antal tegn.
- Antal linjer.
- Antal afsnit.
- Skaleringsindstillinger.
- Organisation.
- Navn på teamlederen.
Exiftværktøj
Kommandoen Exiftværktøj Det kan også bruges til at se metadataene i et Word-dokument.
Brug
exiftool nombre_archivo.docx
En anden måde at se metadataene på er ved at ændre filtypendelsen til zip-format. Af sikkerhedsmæssige årsager gør vi dette med en kopi.
cp nombre_archivo.docx copia_archivo.zip
Vi pakker filen ud og åbner den mappe, vi har brug for
unzip copia_archivo.zip -d docxinfo
Vi læser dataene fra filerne
cat docxinfo/docProps/core.xml
For dokumentmetadata
cat docxinfo/docProps/apdp.xml
For applikationsmetadata
cat docxinfo/docProps/app.xml
Begge bruger exiftool Vi kan manuelt redigere metadataene. Igen er proceduren med exiftool den samme, som vi gjorde med PDF-filerne.
exiftool -parámetro "nombre_del_parámetro" nombre_del_archivo.docx
Vi kan gøre det samme manuelt på følgende måde:
Vi laver en sikkerhedskopi
cp nombre_archivo.docx copia_archivo.zip
Vi pakkede den ud i en mappe kaldet metadata.
unzip copia_archivo.zip -d metadatos
Lad os gå til mappen
cd metadatos
Vi åbner editoren
for dokumentmetadata
nano docProps/core.xml
nano docProps/apdp.xml for applikationsmetadata
Vi pakker filen om som en docx
zip -r ../nombre_archivo2.docx *
Kommandoen opretter det nye dokument uden for mappen. metadatos.