Link

Pandas join, merge e concat.

O Pandas é uma das bibliotecas Python mais poderosa para trabalhar com análise e tratamento de dados.

Uma das capacidades que o Pandas tem de poderoso é combinar informações de fontes de dados diferentes para cruzamento de dados.

Para isso, o Pandas tem os seguintes métodos: join, merge e concat.

Neste pequeno tutorial vamos mostrar como cruzar 2 DataFrames diferentes utilizando os métodos ditos.

O método join e o merge são similares na questão de juntar 2 colunas, a diferença estará somente no modo de operação, já o concat permite juntar tanto colunas como linhas.

Acesse o tutorial completo em: https://nakatech.herokuapp.com/article/2022/pandas.html.

Link

Apache OpenNLP.

Hoje, quando falamos de ferramentas para Data Science e Machine Learning lembramos do Python.

Mas a maioria das linguagens de programação tem sua biblioteca para essa finalidade.

O Java possui várias bibliotecas para Machine Learning e Data Science, nesse Post vamos falar sobre o uso da biblioteca OpenNLP da Apache.

O OpenNLP é utilizado para tokenizar, reconhecer nomes, línguas, entre outras capacidades utilizadas em Data Science e Machine Learning.

O projeto é totalmente open source e mantido por desenvolvedores voluntários.

Acesse o tutorial completo em: https://nakatech.herokuapp.com/article/2021/apacheOpenNlp.html.