Categorias
Data Science Estatística

PCA e K-Means para decifrar o genoma

Este é um estudo de caso reproduzindo a análise de Alexander N. Gorban e Andrei Y. Zinovyev, publicada no livro Principal Manifolds for Data Visualization and Dimension Reduction (Lecture Notes in Computational Science and Engineering). O capítulo original pode ser baixado na íntegra no site do autor (http://www.ihes.fr/~zinovyev/) e o livro pode ser adquirido na […]

Categorias
Data Science Estatística

Regressão logística na epidemiologia (e medicina): o nascimento!

Bem, essa é apenas uma breve notinha histórica sobre o “nascimento” da regressão logística em estudos epidemiológicos na medicina. A história foi a seguinte: Em 1948, o National Heart Institute (USA) iniciou um grande estudo epidemiológico sobre doenças cardiovasculares chamado “The Framingham Heart Study“. Ele foi delineado basicamente como um grande estudo de coorte na […]

Categorias
Data Science Softwares

Que software usar para análise de dados?

Uma pergunta que sempre me fazem quando converso com alguém sobre análise de dados é: “que software devo usar para isso”? E a resposta é, invariavelmente, “depende”. Existem ótimas opções open-source e comerciais que fazem basicamente a mesma coisa, de modo mais fácil ou mais difícil. Informo aqui as principais opções existentes hoje em dia. […]