OCR com Python.

O OCR ou o acrônimo em português de “Reconhecimento Ótico de Caracteres” é a capacidade de extração de caracteres de imagens.

A tecnologia do OCR pode ser aplicado em várias soluções como análise de contratos, cheques, imagens digitalizados, também pode ser utilizado em iot para verificar placas de carros.

Com Python podemos utilizar o pacote pytesseract para acessar o software Tesseract e extrair caracteres de imagens.

Como instalar e utilizar pytesseract.

Primeiro precisamos instalar o tesseract para utilizar a capacidade de OCR.

$ sudo apt-get install tesseract-ocr

Agora precisamos instalar o pytesseract para acessar o tesseract:
$ pip install pytesseract

Agora já podemos testar uma extração de caracteres via Python.

Vamos extrair o texto da imagem abaixo, nesse caso o meu nome “Sidney”.

>>>import Image
>>>import pytesseract
>>>print pytesseract.image_to_string(Image.open('/tmp/teste.jpeg'))

Conclusão.

Uma forma simples e rápida utilizando pytesseract e Tesseract, podemos fazer aplicações utilizando OCR sem muito esforço e com poucas linhas de comando.

Ubuntu 18.04 LTS.

Finalmente atualizei meu Ubuntu versão 16 para a 18.04 LTS(Bionic Beaver).

As primeiras impressões foram ótimas, pois a versão 16 no meu computador não estava muito legal. Lenta, gerando alguns erros e com alguns problemas de interface gráfica, atualizando para versão 18, o computador ficou mais rápido e a interface mais limpa.

Agora com suporte até 2023, essa versão vem com a interface GNOME 3.28 pois a interface Unity foi interrompida.

A suíte de pacotes para escritório é o LibreOffice 6, navegador padrão é o Mozilla Firefox 59.0.2 e a JVM é o OpenJDK 10.

A versão do Kernel utilizado na versão 18.04 é a 4.15 com otimizações para Hardware AMD e agora somente para processadores 64 bits.

Melhorias para a próxima Release.

Essa ainda não é a versão final, existem várias melhorias sendo feitas para essa nova versão de Ubuntu.

A versão beta do Ubuntu 18.10(Cosmic Cuttlefish) está disponível para atualização, nessa versão a interface é atualizada para o GNOME 3.30 que tem uma otimização no uso da memória RAM.

Essa versão também vem com Mozilla Firefox 61, LibreOffice 6.1.1, Shotwell 0.30 e o Thunderbird 52.

O tempo de carregamento no desktop também faz parte desse pacote de atualização do Minor.

Vou esperar por uma versão oficial para atualizar para versão 18.10, pois essa versão 18.04 para mim está ótima até agora.

Conclusão.

Simples e eficaz é como descrevo a versão 18.04 do Ubuntu, ficou realmente rápido uma máquina que estava bem lenta com a versão anterior.
Estou aguardando ansiosamente os próximos lançamentos do Ubuntu para testar as melhorias.

Link

Análise de dados com Python+Pandas.

O Pandas é uma lib open source de alta performance para fazer análise de dados.

Bastante utilizado por comunidades acadêmicas, o Pandas vem ganhando mercado pelo seu uso simples e rapidez em analisar e organizar dados.

Combinado com ferramentas IPython e outras lib’s, o Pandas se torna uma ferramenta muito poderosa e performática para análise de dados para o Python.

Para quem não quer utilizar ou aprender a linguagem R, a combinação Pandas e Python já satisfaz a maioria das capacidades do R.

Para acessar todo material acesse Nakatech.

Linux Ubuntu.

Já faz alguns anos que a distribuição Linux Ubuntu caiu no gosto dos Brasileiros.

Em empresas de tecnologia, mais precisamente na área de desenvolvimento, um grande número de programadores estão utilizando o Ubuntu como sistema operacional.

Algumas marcas de computadores e notebooks como a Dell e a Positivo já estão distribuindo seus equipamentos com Ubuntu.

Algumas vantagens de usar Linux Ubuntu.
  • Interface gráfica amigável e bem intuitiva, muito próximo da usabilidade Microsoft Windows;
  • Suporte gratuito, quando a instalação é feita com a versão LTS;
  • Para desenvolvimento de softwares, o Ubuntu já vem embarcado um grande número de ferramentas para esse fim;
  • Grande número de usuários, ficando mais fácil de encontrar ajuda para resolver alguns problemas pela internet;
  • Grande número de aplicativos e ferramentas para os mais variados fins;
  • Totalmente grátis.
Algumas desvantagens de usar Linux Ubuntu.
  • Alguns aplicativos não são tão bons quanto ao original como o OpenOffice que tenta suprir a necessidade do Microsoft Office;
  • Jogos não são o forte do Linux, apesar de que grande número de jogos são desenvolvidos em Unix;
  • Pode haver falta de suporte a alguns hardware por falta de driver.

Conclusão.

Acredito que exista mais vantagens do que desvantagens em utilizar Linux Ubuntu, não que o Microsoft Windows seja ruim, apenas estamos comparando os dois sistemas operacionais. O Windows tem as suas vantagens como pacote Office, Photoshop e Steam e o Linux Ubuntu tem suas vantagens como desempenho a seu favor.

Acesse o material original em Nakatech.