Programação E Ferramentas

Hackeando o R: estratégia split-apply-combine

Veja como aplicar essa estratégia de maneira eficiente utilizando os pacotes do tidyverse: dplyr+tidyr+purrr

Fellipe Gomes

6 minute read

Diagrama da estratégia split-apply-combine com dplyr, tidyr e purrr no R <p>Geralmente em uma análise de dados precisamos compreender, além do comportamento geral dos dados, o seu comportamento de acordo com alguns segmentos.</p>

Um ano de blog!

Este post traz uma retrospectiva do que aconteceu por aqui em 1 ano de blog, foi muito empolgante o término do desafio que fiz a mim mesmo e a animação para novos desafios continua!

Fellipe Gomes

10 minute read

Colagem de visualizações e projetos do primeiro ano do blog de Data Science <p>Agora em dezembro encerro um desafio pessoal de fazer pelo menos um post por mês durante o ano de 2018 e estou muito animado com o término deste ciclo! Espero ter contribuído um pouquinho com a comunidade de Estatística e Ciência de Dados que está maior a cada dia e cada vez mais importante.</p>

Seu app, RStudio e Shiny Server na nuvem do Google

Uma maneira prática de hospedar o app desenvolvido no post no Shiny Server e ter seu próprio RStudio Server na nuvem do Google em uma máquina virtual Ubuntu 16.04.

Fellipe Gomes

12 minute read

Arquitetura de deploy de Shiny Server e RStudio Server na Google Cloud Platform <p>Uma das várias maneiras de se implementar o <a href="https://www.rstudio.com/products/rstudio/download-server/">RStudio Server</a> e o <a href="https://www.rstudio.com/products/shiny/download-server/">Shiny Server</a> é através de serviços de nuvem que fornecem máquinas virtuais. Empresas gigantes no mercado como Amazon Web Services (AWS), Microsoft, Google, IBM, Oracle etc têm investido pesado nestes serviços e a escolha de qual cloud utilizar deve ser feita de acordo com a necessidade do…

Com que frequência ocorrem acidentes na ponte Rio-Niterói?

Com os dados públicos da PRF e um pouco de Estatística buscaremos respostas para esta e outras perguntas relacionadas ao número de acidentes na Ponte Rio-Niterói.

Fellipe Gomes

19 minute read

Mapa e gráficos estatísticos sobre frequência de acidentes na Ponte Rio-Niterói <p>Estudar em outra cidade têm suas vantagens e desvantagens, durante toda a graduação atravessei Baía de Guanabara pela Ponte Presidente Costa e Silva, (popularmente conhecida como Ponte Rio–Niterói) assim como todas as pessoas que fazem esse trajeto diariamente e diante de tanta beleza natural com a vista panorâmica da Baía como os espetáculos proporcionados pelo pôr do sol, os pássaros ou a beleza inegável do Pão de Açúcar também é notável a beleza fruto da maior habilidade humana: a…

Um estudo sobre modelos de aprendizagem baseados em árvores com desafio do Kaggle

Um estudo aplicado de modelos de aprendizagem baseados em árvores utilizando a base de dados do Kaggle para prever o preço final de casas residenciais em Ames, Iowa, utilizando uma variedade de aspectos

Fellipe Gomes

30 minute read

Visualização de árvore de decisão e comparação de modelos ensemble para previsão de preços <p>Segundo o <a href="https://en.wikipedia.org/wiki/Kaggle">Wikipédia</a>: “Kaggle é a maior comunidade mundial de cientistas de dados e machine learning.” Aprendo muito estudando as resoluções de alguns competidores pois lá é possível conferir tanto as metodologias utilizadas pelos competidores quando os códigos e é notável o cuidado dos participantes para que seja possível a reprodutibilidade dos resultados, o que pode impulsionar o aprendizado.</p>

Modelo Bayesiano do Zero

Um pouco sobre as duas grandes escolas de inferência, contas e implementação de um modelo linear bayesiano na mão para dados simulados e para dados reais

Fellipe Gomes

16 minute read

Comparação entre ajuste de modelo linear clássico e bayesiano com distribuições a posteriori <p>Através da modelagem estatística é possível tomar decisões sobre diversos assuntos de interesse como por exemplo na análise de risco de crédito, previsões de quantidade de chuva em um dado local, estimativas de erros ou falhas de um novo produto ou serviço além de diversas áreas como na Educação, Economia, nas Ciências Sociais, Saúde etc.</p>

Séries temporais com Google Trends e R

Como acessar a API do Google Trends em R com o pacote gtrendsR para coletar e analisar séries temporais de buscas populares.

Fellipe Gomes

30 minute read

Gráfico de tendências do Google Trends analisado como série temporal em R <p>O <a href="https://trends.google.com.br/">Google Trends</a> é uma ferramenta gratuita, muito poderosa e que pode ser implementada para ajudar em nossas estratégias de análises.</p>

Produzindo e formatando um documento Word direto em R

As análises foram feitas em R e agora? Geralmente um bom PDF ou HTML são suficientes mas e se o destino da análise tiver que ser um documento Word?

Fellipe Gomes

9 minute read

Documento Word formatado e gerado automaticamente a partir do R com RMarkdown <p>Como já mencionei no <a href="https://gomesfellipe.github.io/post/2018-01-12-tabelas-incriveis-com-r/tabelas-incriveis-com-r/">post sobre tabelas incríveis com R</a>, a tarefa de um estatístico (ou Data Scientist, em sua versão diluída e mais comercial) vai muito além do planejamento, análises, inferência, sumarização e interpretação de observações para fornecer a melhor informação possível a partir do dados disponíveis. A produção final dos relatórios é fundamental e na grande maioria das…

O que são CheatSheets, gamificação e por que aprender R é tão divertido?

Você costuma ler o manual de instruções? Veja como equipes têm trabalhado para contribuir e facilitar o aprendizado da linguagem R ampliando a intersecção entre a curiosidade de nossa infancia e o amadurecimento. Programar se torna uma tarefa divertida e prática mas sem abandonar o manual de instruções escrito por quem sabe do que esta falando!

Fellipe Gomes

7 minute read

Coleção de cheatsheets do RStudio para aprendizado gamificado de R <p>Quando eramos crianças geralmente não tinhamos o costume de ler o manual das coisas não é mesmo? Particularmente eu sempre gostei de aprender como as coisas funcionavam diretamente com a prática para poder usá-las depois. Adorava buscar entender como as coisas se encaixavam ao montar os brinquedinhos do kinder-ovo sem ler as instruções ou criar diferentes combinações com lego customizados, por exemplo. Acredito que isso seja da natureza de toda criança!</p>

Carnaval e mapas interativos com R

Carnaval esta começando e muita gente quer saber: "Onde tem bloco??" Para ajudar a responder essa pergunta e orientar os foliões hoje vou mostrar como podemos obter referencias geograficas a partir de endereços e criar mapas interativos usando R!

Fellipe Gomes

163 minute read

Mapa interativo do Rio de Janeiro com localização de blocos de carnaval feito com Leaflet em R <p>Fevereiro começando e o carnaval já está ai, especialmente se você mora no Rio de Janeiro já deve ter passado por algum bloco e a pergunta que todo mundo faz no carnaval pelo menos uma vez é: “Onde tem bloco?”.</p>
Politica de Privacidade | Termos de Uso