Post - Fellipe Gomes - Data Science Blog

Vou te provar que da para fazer Grafos bonitos em R!

Neste post vamos coletar notícias via web scrapping, detectar entidades dos textos e criar um grafo utilizando ggplot2

December 3, 2021 Fellipe Gomes

8 minute read

Grafo de rede de entidades extraídas de notícias visualizado com ggplot2 em R

Durante os anos de 2020 e 2021 fiz um <a href="https://educacao-executiva.fgv.br/df/brasilia/cursos/mba-pos-graduacao/mba-presencial/mba-executivo-em-business-analytics-e-big-data">MBA Executivo em Business Analytics e Big Data</a> na FGV e uma das disciplinas que gostei bastante abordou a análise de mídias sociais com técnicas de mineração de texto e processamento de linguagem natural.

Solução Final - Porto Seguro Data Challenge [3º lugar]

Confira a estratégia aplicada para a competição de machine learning do Porto Seguro hospedada no Kaggle

November 1, 2021 Fellipe Gomes

16 minute read

Resultado final do Porto Seguro Data Challenge no Kaggle com 3º lugar e análise SHAP

Em Agosto e 2021 a Porto Seguro lançou um desafio no Kaggle que consistia em estimar a propensão de aquisição de novos produtos. Tratava-se de um problema de classificação e foi bem desafiador principalmente por 2 motivos:

Otimizando pipelines que envolvem dados desbalanceados

Utilizaremos o framework tidymodels para machine learning em R com o auxílio do pacote workflowsets para otimizar pipelines de dados desbalanceados

June 28, 2021 Fellipe Gomes

12 minute read

Pipeline de workflowsets do tidymodels comparando modelos para dados desbalanceados

A tarefa de classificação com dados desbalanceados é muito comum na vida real podendo variar desde um leve viés até um enorme desequilíbrio na distribuição da classe de interesse. Problemas mais comuns envolvem:

Ciência de Dados - Uma visão geral

Nesta apresentação tive a oportunidade de falar um pouco sobre a minha visão e cases relacionados a esta área tão extensa e incrível que é a ciência de dados!

May 24, 2021 Fellipe Gomes

1 minute read

Apresentação sobre Ciência de Dados com diagrama de Venn das competências do cientista de dados

Com a elevada quantidade de dados sendo produzidos a todo instante e o poder computacional cada vez maior, a ciência de dados tem ganhado muito espaço no mercado. Isso ocorre pois suas ferramentas nos permitem descobrir soluções ocultas a partir de enormes massas de dados desorganizados combinando programação, matemática, estatística e compreensão contextual.

Prevendo a qualidade do sono utilizando Machine Learning

Utilizaremos dados reais coletados pelo celular para gerar previsões a partir de uma pequena base de dados com target desbalanceada

March 4, 2021 Fellipe Gomes

37 minute read

Gráficos de importância de variáveis e métricas de classificação para previsão de qualidade do sono

Sim, exatamente! Neste post analisaremos dados de um tracking que venho fazendo desde 2017 com informações relacionadas à um sono de qualidade.

Desenvolva um bot e receba resultados de Machine Learning no seu Smartphone para ajudar nos investimentos

Entenda a lógica de como montar uma carteira, coletar dados de finança em tempo real, treinar um modelo de Machine Learning com Prophet (Facebook Open Source) e receber análises automatizadas no Smartphone

March 25, 2020 Fellipe Gomes

20 minute read

Dashboard de alertas de investimento com previsões do modelo Prophet no smartphone

Como esta sua situação financeira? Caso tenha alguma reserva pode ser interessante pensar em investimentos pois a poupança já não é mais garantia de lucro no longo prazo, não acredita?

Como automatizar relatórios longos e repetitivos com RMarkdown

Veja como fazer um relatório estatístico "extenso e repetitivo" sem utilizar copiar e colar nenhuma vez

September 13, 2019 Fellipe Gomes

10 minute read

Fluxo de automação de relatórios estatísticos com RMarkdown e loops programáticos

Uma tarefa comum no dia a dia de um estatístico (ou cientista de dados) é a elaboração de relatórios para passsar ao restante da equipe e/ou tomadores de decisão os resultados encontrados e muitas vezes essa tarefa pode parecer desgastante quando os relatórios são muitos extensos e repetitivos.

Hackeando o R: estratégia split-apply-combine

Veja como aplicar essa estratégia de maneira eficiente utilizando os pacotes do tidyverse: dplyr+tidyr+purrr

April 5, 2019 Fellipe Gomes

6 minute read

Diagrama da estratégia split-apply-combine com dplyr, tidyr e purrr no R

Geralmente em uma análise de dados precisamos compreender, além do comportamento geral dos dados, o seu comportamento de acordo com alguns segmentos.

Um ano de blog!

Este post traz uma retrospectiva do que aconteceu por aqui em 1 ano de blog, foi muito empolgante o término do desafio que fiz a mim mesmo e a animação para novos desafios continua!

December 26, 2018 Fellipe Gomes

10 minute read

Colagem de visualizações e projetos do primeiro ano do blog de Data Science

Agora em dezembro encerro um desafio pessoal de fazer pelo menos um post por mês durante o ano de 2018 e estou muito animado com o término deste ciclo! Espero ter contribuído um pouquinho com a comunidade de Estatística e Ciência de Dados que está maior a cada dia e cada vez mais importante.

Análise de sobrevivência com dados do jogo PUBG disponíveis no Kaggle

O que interefere na probabilidade de um indivíduo sobreviver? Quais fatores apresentam efeito no risco de morte em um intervalo de tempo? Neste post buscaremos evidências estatísticas para responder estas perguntas em dados abertos do PUBG hospedados no Kaggle

November 28, 2018 Fellipe Gomes

19 minute read

Curvas de sobrevivência de Kaplan-Meier aplicadas a dados do jogo PUBG do Kaggle

Análise de sobrevivência é um termo que se refere a situações médicas e é caracterizada pela sua variável resposta, que pode ser apresentada de três formas: probabilidade de sobrevivência, taxa de incidêcia e taxa de incidência acumulada.

Home

CV

Blog

Apps

Recomendações

Categorias

Contato

About

☕ Apoie o blog