
Ainda vejo muitas desenvolvedores com dúvidas sobre Unicode e character encodings, muitas vezes por não compreender os fundamentos e padronização do Unicode e ASCII.
O Unicode é um padrão de representação de texto projetado com base no código ASCII com a diferença que o Unicode é capaz de interpretar quase todos os caracteres e símbolos.
O Character Encodings vai determinar dentro do Unicode qual o padrão de mapeamento dos caracteres e símbolos é utilizado, os mais conhecidos são UTF-8, UTF-16 e UTF-32.
Existem outros encodings como o latin-1(ISO/8859-1) mas vamos abordar somente a família UTF.
Lembrando que os padrões de Unicode e seus encodings são padrões para qualquer área de computação, mas aqui utilizaremos Python 3 para exemplos mais práticos.
Acesse o tutorial completo em: https://nakatech.herokuapp.com/article/unicode.html.