Fundamentos De Data Science

Carnaval e mapas interativos com R

Carnaval esta começando e muita gente quer saber: "Onde tem bloco??" Para ajudar a responder essa pergunta e orientar os foliões hoje vou mostrar como podemos obter referencias geograficas a partir de endereços e criar mapas interativos usando R!

Fellipe Gomes

163 minute read

Mapa interativo do Rio de Janeiro com localização de blocos de carnaval feito com Leaflet em R <p>Fevereiro começando e o carnaval já está ai, especialmente se você mora no Rio de Janeiro já deve ter passado por algum bloco e a pergunta que todo mundo faz no carnaval pelo menos uma vez é: “Onde tem bloco?”.</p>

O paradoxo dos aniversários com simulação e probabilidade

Quanto você acha que é a probabiliddade num grupo de 23 pessoas escolhidas aleatoriamente que duas delas farão aniversário no mesmo dia? Acreditaria se eu te dissesse que essa chance é maior do que 50%? A probabilidade é contra intuitiva e neste post vamos demonstrar de forma analitica e atraves de simulação esse e outros resultados além de dissertar um pouco sobre a história e conceitos importantes de probabilidade

Fellipe Gomes

7 minute read

Simulação do paradoxo dos aniversários mostrando probabilidades e histogramas <p>O uso de cálculo de probabilidades para avaliar incertezas já é utilizado a centenas de anos. Foram tantas áreas que se encontraram aplicações (como na medicina, jogos de azar, previsão do tempo…) que hoje não restam dúvidas de que os dados são onipresentes, ainda mais em plena era da informação.</p>

Tabelas Incríveis com R

Alguns pacotes que serão bem úteis na hora de criar tabelas lindas e informativas!

Fellipe Gomes

8 minute read

Exemplos de tabelas formatadas e coloridas criadas com pacotes R como kableExtra e formattable <p>O trabalho do estatístico vai muito além do planejamento, sumarização e interpretação de observações para fornecer a melhor informação possível a partir do dados disponíveis. O processo de analises deve ser tratado na etapa final de todo projeto ou pesquisa que envolva apresentação dos resultados, não é atoa que já até existem áreas dentro da ciência de dados focada nesta tarefa, recebendo o título de “Data Artist”.</p>

Manipulando dados com dplyr

Tutorial completo do pacote dplyr para manipulação de dados em R: filtrar, selecionar, agrupar e transformar data frames com o tidyverse.

Fellipe Gomes

5 minute read

Logo do pacote dplyr do tidyverse para manipulação de dados em R <p>A análise exploratória dos dados é uma tarefa de bastante relevância para entendermos a natureza dos dados e o tempo de análise gastro é muito precioso. É necessária bastante curiosidade e criatividade para fazer uma boa análise exploratória dos dados pois é difícil receber aqueles dados bonitinhos igual aos nativos do banco de dados do <strong>R</strong>.</p>

Tipos de relações entre variáveis

Guia prático para escolher a medida de correlação correta para cada tipo de variável: numérica, categórica e ordinal. Exemplos visuais com ggplot2 em R.

Fellipe Gomes

11 minute read

<p>Vimos no <a href="https://gomesfellipe.github.io/post/tipos-de-correlacoes/">último post</a> sobre quais tipos de medidas de correlação e associação podem ser calculadas para identificar o grau de associação (ou dependência) entre as variáveis.</p>

Tipos de Correlações

Aprenda os principais tipos de correlação e associação em R: Pearson, Spearman, Kendall, Qui-quadrado, teste de Fisher, V de Cramer e Kappa com exemplos práticos.

Fellipe Gomes

5 minute read

<p>De maneira geral, quando estamos interessados em avaliar o grau de associação entre duas variáveis calculamos os <em>coeficientes de associação</em> ou <em>correlação</em> entre variáveis.</p>
Politica de Privacidade | Termos de Uso