Ascii – Nakatani's Concept place

Ainda vejo muitas desenvolvedores com dúvidas sobre Unicode e character encodings, muitas vezes por não compreender os fundamentos e padronização do Unicode e ASCII.

O Unicode é um padrão de representação de texto projetado com base no código ASCII com a diferença que o Unicode é capaz de interpretar quase todos os caracteres e símbolos.

O Character Encodings vai determinar dentro do Unicode qual o padrão de mapeamento dos caracteres e símbolos é utilizado, os mais conhecidos são UTF-8, UTF-16 e UTF-32.

Existem outros encodings como o latin-1(ISO/8859-1) mas vamos abordar somente a família UTF.

Lembrando que os padrões de Unicode e seus encodings são padrões para qualquer área de computação, mas aqui utilizaremos Python 3 para exemplos mais práticos.

Acesse o tutorial completo em: https://nakatech.herokuapp.com/article/unicode.html.