Forskellen mellem ASCII og Unicode

Den vigtigste forskel mellem ASCII og Unicode er, at ASCII repræsenterer små bogstaver (a-z), store bogstaver (A-Z), cifre (0-9) og symboler såsom tegnsætningstegn, mens Unicode repræsenterer bogstaver på engelsk, arabisk, græsk osv.., matematiske symboler, historiske skrifter og emoji, der dækker en bredere vifte af tegn end ASCII.

ASCII og Unicode er to kodningsstandarder inden for elektronisk kommunikation. De anvendes til at repræsentere tekst i computere, i telekommunikationsudstyr og andet udstyr. ASCII koder 128 tegn. Den omfatter engelske bogstaver, tal fra 0 til 9 og et par andre symboler. På den anden side dækker Unicode et større antal tegn end ASCII. Det repræsenterer de fleste skriftsprog i verden. Unicode koder sprogbogstaver, tal og et stort antal andre symboler. Kort sagt er Unicode en overmængde af ASCII.

Nøgleområder, der dækkes

1. Hvad er ASCII
– Definition, funktionalitet
2. Hvad er Unicode
– Definition, funktionalitet
3. Forholdet mellem ASCII og Unicode
– Omrids af forbindelsen
4. Forskellen mellem ASCII og Unicode
– Sammenligning af de vigtigste forskelle

Nøglebegreber

ASCII, Unicode, Computere

Hvad er ASCII

ASCII står for American Standard Code for Information Interchange. Det bruger tal til at repræsentere tekst. Tal (1,2,3 osv.), bogstaver (a, b, c osv.) og symboler (!) kaldes tegn. Når der er tale om et stykke tekst, konverterer ASCII hvert tegn til et tal. Dette sæt tal er lettere at lagre i computerens hukommelse. Med enkle ord kaldes det at tildele et tal til et tegn for kodning.

F.eks. tildeles det store bogstav “A” tallet 65. På samme måde henviser 65 til bogstavet “A”. På samme måde har hvert tegn et nummer i ASCII. ASCII-tabellen indeholder alle tegn med tilhørende numre. ASCII bruger 7 bits til at repræsentere et tegn. Derfor repræsenterer det maksimalt 128 (27) tegn.

Figur 1: ASCII-tabel

ASCII-tegn anvendes i programmering, datakonvertering, tekstfiler og grafisk kunst samt i e-mails. Programmørerne kan bruge ASCII til at repræsentere beregninger på tegn. Forskellen mellem små bogstaver og store bogstaver er altid 32. F.eks. er ASCII-værdien af “a” 97 og “A” er 65. Så a – A = 32. Hvis ASCII-værdien for et hvilket som helst bogstav er kendt, er det derfor muligt at finde ASCII-værdien for det tilsvarende store eller lille bogstav. Desuden bruges ASCII i grafisk kunst til at repræsentere billeder ved hjælp af tegn.

En ulempe ved ASCII er, at det kun kan repræsentere 128 tegn. Det har ikke repræsentationer for de fleste matematiske og andre symboler.

Hvad er Unicode

Unicode er et alternativ. Det vedligeholdes af Unicode Consortium. Det dækker en bred vifte af tegn. Den indeholder repræsentationer for bogstaver i sprog som engelsk, græsk, arabisk osv., matematiske symboler, emoji og mange flere.

Figur 2: Unicode

Der er tre typer kodning til rådighed i Unicode. De er UTF-8, UTF – 16 og UTF -32. UTF anvender 8 bit pr. tegn, UTF-16 anvender 16 bit pr. tegn og UTF-32 anvender 32 bit for et tegn. I UTF-8 er de første 128 tegn ASCII-tegn. Derfor er ASCII gyldigt i UTF-8. Normalt anvendes Unicode i forbindelse med internationalisering og lokalisering af computersoftware. Denne standard bruges også i operativsystemer, XML, .NET framework og programmeringssprog som Java.

Sammenhæng mellem ASCII og Unicode

Unicode er en overmængde af ASCII.

Forskellen mellem ASCII og Unicode

Definition

AcsII eller American Standard Code for Information Interchange er en standard for tegnkodning til elektronisk kommunikation. Unicode er en standard i computerindustrien for konsistent kodning, repræsentation og håndtering af tekst udtrykt i de fleste af verdens skriftsystemer.

Står for

ASCII står for American Standard Code for Information Interchange. Unicode står for Universal Character Set.

Supporting Characters

ASCII indeholder repræsentationer for cifre, engelske bogstaver og andre symboler. Det understøtter 128 tegn. Unicode understøtter en bred vifte af tegn. Dette er den største forskel mellem ASCII og Unicode.

Bits pr. tegn

Dertil kommer, at ASCII bruger 7 bits til at repræsentere et tegn, mens Unicode bruger 8bit, 16bit eller 32bit afhængigt af kodningstypen.

Krævet plads

Unicode kræver mere plads end ASCII.

Konklusion

Unicode repræsenterer de fleste skriftsprog i verden. ASCII har sin pendant i Unicode. Forskellen mellem ASCII og Unicode er, at ASCII repræsenterer små bogstaver (a-z), store bogstaver (A-Z), cifre (0-9) og symboler som f.eks. tegnsætningstegn, mens Unicode repræsenterer bogstaver på engelsk, arabisk, græsk osv. matematiske symboler, historiske skrifter, emoji, der dækker et bredere udvalg af tegn end ASCII.

Reference:
Image Courtesy:

1. “ASCII-Table-wide” Af ASCII-Table.svg: ZZT32derivatarbejde: LanoxxthShaddow – ASCII-Table.svg (Public Domain) via Commons Wikimedia
2. “Unicode logo” Af Ukendt – de:Bild:Unicode logo.jpg (Public Domain) via Commons Wikimedia

Skriv et svar

Din e-mailadresse vil ikke blive publiceret.