
Unicode
Cos'è Unicode
Unicode è uno standard internazionale di codifica dei caratteri che definisce e rappresenta tutti i caratteri delle lingue del mondo in modo univoco e universale.
Grazie a Unicode, non importa se una pagina web contiene caratteri latini o di altre lingue che utilizzano alfabeti più complessi come il cinese, l'arabo o il russo.
In tutti i casi il computer è in grado di visualizzare il contenuto del documento in modo corretto, indipendentemente dal sistema operativo e dal paese in cui è stato costruito il dispositivo che utilizza l'utente.
Perché è stato creato Unicode
Prima dell'introduzione di Unicode, ogni lingua aveva un proprio sistema di codifica dei caratteri.
Questo rendeva molto difficile la visualizzazione del testo e lo scambio di informazioni tra dispositivi digitali che utilizzavano un set di caratteri diverso.
Ad esempio, il giapponese e il cinese utilizzavano sistemi di scrittura basati su caratteri non supportati dai tradizionali set di caratteri latini come ASCII o ISO-8859.
Unicode è stato sviluppato nel 1991 dall'Unicode Consortium per risolvere questo problema.
Nota. Unicode Consortium è un'organizzazione internazionale composta da esperti di informatica e linguistica.
L'idea era quella di avere un unico sistema di codifica dei caratteri universale utilizzabile ovunque.
Come funziona Unicode
Nel codice Unicode ogni carattere è rappresentato da un codice numerico univoco, che consente ai computer di individuare e visualizzare correttamente il testo indipendentemente dalla lingua, dalla tecnologia o dal dispositivo digitale usato dall'utente.
Ti faccio un esempio pratico.
La lettera "A" maiuscola è rappresentata dal punto di codice U+0041, mentre il carattere cinese "一" è rappresentato dal punto di codice U+4E00.
Grazie a questi codici numerici, ogni computer può rappresentare qualsiasi carattere.
Esempio. Se un utente cinese scrive un messaggio di posta elettronica usando i caratteri cinesi e la invia a un utente americano, quest'ultimo riesce a visualizzare il contenuto originale dell'email. Senza Unicode, in passato l'utente americano avrebbe dovuto installare il set di caratteri cinesi per visualizzare correttamente l'email. Oggi non è più necessario. Un altro esempio sono i software multilingue. Oggi puoi installare lo stesso software multilingua (es. Whatsapp, Telegram, Linux, ecc.) in qualsiasi dispositivo o sistema operativo e scegliere quale sistema di scrittura vuoi utilizzare.
Qual è la differenza tra Unicode e ASCII?
Sono entrambi due standard di codifica dei caratteri usati per rappresentare i caratteri in un formato digitale.
- ASCII
L'ASCII (American Standard Code for Information Interchange) è stato sviluppato negli anni '60 per rappresentare i caratteri dell'alfabeto inglese e alcuni simboli comuni utilizzati nei computer. Il codice ASCII utilizza 7 bit per rappresentare ogni carattere. Quindi, può rappresentare al massimo 128 caratteri. E' stato progetto per rappresentare le lingue con alfabeto latino, ossia le lingue occidentali, europee e americane. - UNICODE
Unicode è stato sviluppato negli anni '90 per superare le limitazioni di ASCII. Può rappresentare i caratteri usati in gran parte delle lingue e degli alfabeti nel mondo. Non solo la lingua inglese. Unicode utilizza da 8 a 32 bit per rappresentare ogni carattere. Quindi, può rappresentare oltre 1 milione di caratteri.diversi. Unicode include anche un insieme di simboli e emoji non presenti in ASCII. Attualmente la versione più utilizzata è quella a 16 bit che codica circa 60mila caratteri. Per la precisione 216−1=65.535 caratteri
Nota. I primi caratteri di Unicode sono gli stessi della codifica ASCII. In questo modo Unicode è perfettamente compatibile e utilizzabile anche nei vecchi sistemi basati sul codice ASCII.
Nel corso del tempo il codice Unicode è stato aggiornato per includere nuovi font e set di caratteri per supportare tutte le lingue e sistemi di scrittura del mondo.
Oggi Unicode è usato praticamente ovunque nella creazione di documenti digitali e nello sviluppo di applicazioni e software multilingue.
In conclusione, grazie a Unicode lo scambio di informazioni digitalizzate è diventato molto più semplice che in passato.