Begrepet Unicode refererer til et standardtegnsystem som er laget for å tillate enkel håndtering av databehandling, visualisering og overføring av skrifter fra forskjellige språk og tekniske fagdisipliner, men inkluderer også klassiske tekster fra språk som allerede er død. Med andre ord og på en mer spesifikk måte er Unicode et vanlig tegnformat, der hvert av tastaturkarakterene på en datamaskin finnes. I samsvar med det som kommer til uttrykk, stammer begrepet fra de tre målene som forfølges, som er universalitet, unikhet og enhetlighet .

Unicode leverer spesielt et unikt nummer for hver av tegnene, uten implikasjon av plattformen, språket, programmet, som letter overføringen mellom forskjellige kodesystemer og plattformer. Som du kan se , dekker Unicode ikke bare bokstaver, men det er også symboler, tall og andre.
En karakterkoding definerer en tabell som representerer tegn som tall . Et nummer er assosiert med hvert tegn. I Unicode kalles dette nummeret kodepunkt. Forgjengeren til Unicode er kjent som "ASCII", med forskjellen at sistnevnte bare inkluderte karakterene som ble brukt på det engelske språket.
Denne standarden er opprettholdt av UTC-akronymet til Unicode Technical Committee, integrert i Unicode Consortium, en ideell organisasjon, der store og berømte selskaper som Apple, Microsoft, Google, Yahoo, Adobe er involvert med forskjellige grader av involvering. , IBM, SAP, Oracle eller enheter som det prestisjetunge University of Berkeley og individuelle fagpersoner og akademikere. Unicode Consortium opprettholder et veldig nært forhold til ISO / IEC, som det siden 1991 har opprettholdt en avtale om å synkronisere standardene som inneholder de samme tegnene og kodepunktene.