R

Solução Final - ML Olympiad [1º lugar]

Solução vencedora (1º lugar) da ML Olympiad do Kaggle: estratégia analítica completa com CatBoost e R para classificação em dados de saúde pública.

Fellipe Gomes

5 minute read

Resultado do 1º lugar na ML Olympiad do Kaggle com modelo de classificação CatBoost <p>O <a href="https://www.meetup.com/TensorFlowSP/events/284607061/">TFUG - TensorFlow Users Group de São Paulo</a> lançou uma nova <a href="https://www.kaggle.com/competitions/ml-olympiad-ensure-healthy-lives">competição no Kaggle</a> onde o objetivo era desenvolver modelos para previsão de diagnóstico de síndromes respiratórias, que é um tema relacionado com um dos 17 tópicos de Desenvolvimento Sustentável das Nações Unidas - <em>Boa saúde e bem-estar</em>.</p>

Solução Final - ML Olympiad [2º lugar]

Solução que alcançou o 2º lugar na ML Olympiad do Kaggle: análise exploratória em R, feature engineering e modelagem com CatBoost para prever qualidade educacional.

Fellipe Gomes

25 minute read

Resultado do 2º lugar na ML Olympiad do Kaggle com pipeline de CatBoost <p>No final de Janeiro desde ano (2022) o <a href="https://www.meetup.com/TensorFlowSP/events/284607061/">TFUG - TensorFlow Users Group de São Paulo</a> lançou uma competição no Kaggle para prever as notas do enem que tem relação com um dos 17 tópicos de Desenvolvimento Sustentável das Nações Unidas - <em>Educação de Qualidade</em>.</p>

Vou te provar que da para fazer Grafos bonitos em R!

Neste post vamos coletar notícias via web scrapping, detectar entidades dos textos e criar um grafo utilizando ggplot2

Fellipe Gomes

8 minute read

Grafo de rede de entidades extraídas de notícias visualizado com ggplot2 em R <p>Durante os anos de 2020 e 2021 fiz um <a href="https://educacao-executiva.fgv.br/df/brasilia/cursos/mba-pos-graduacao/mba-presencial/mba-executivo-em-business-analytics-e-big-data">MBA Executivo em Business Analytics e Big Data</a> na FGV e uma das disciplinas que gostei bastante abordou a análise de mídias sociais com técnicas de mineração de texto e processamento de linguagem natural.</p>

Otimizando pipelines que envolvem dados desbalanceados

Utilizaremos o framework tidymodels para machine learning em R com o auxílio do pacote workflowsets para otimizar pipelines de dados desbalanceados

Fellipe Gomes

12 minute read

Pipeline de workflowsets do tidymodels comparando modelos para dados desbalanceados <p>A tarefa de classificação com dados desbalanceados é muito comum na vida real podendo variar desde um leve viés até um enorme desequilíbrio na distribuição da classe de interesse. Problemas mais comuns envolvem:</p>

Prevendo a qualidade do sono utilizando Machine Learning

Utilizaremos dados reais coletados pelo celular para gerar previsões a partir de uma pequena base de dados com target desbalanceada

Fellipe Gomes

37 minute read

Gráficos de importância de variáveis e métricas de classificação para previsão de qualidade do sono <p>Sim, exatamente! Neste post analisaremos dados de um <em>tracking</em> que venho fazendo desde 2017 com informações relacionadas à um sono de qualidade.</p>

Desenvolva um bot e receba resultados de Machine Learning no seu Smartphone para ajudar nos investimentos

Entenda a lógica de como montar uma carteira, coletar dados de finança em tempo real, treinar um modelo de Machine Learning com Prophet (Facebook Open Source) e receber análises automatizadas no Smartphone

Fellipe Gomes

20 minute read

Dashboard de alertas de investimento com previsões do modelo Prophet no smartphone <p>Como esta sua situação financeira? Caso tenha alguma reserva pode ser interessante pensar em investimentos pois a poupança já não é mais garantia de lucro no longo prazo, não acredita?</p>

Como automatizar relatórios longos e repetitivos com RMarkdown

Veja como fazer um relatório estatístico "extenso e repetitivo" sem utilizar copiar e colar nenhuma vez

Fellipe Gomes

10 minute read

Fluxo de automação de relatórios estatísticos com RMarkdown e loops programáticos <p>Uma tarefa comum no dia a dia de um estatístico (ou cientista de dados) é a elaboração de relatórios para passsar ao restante da equipe e/ou tomadores de decisão os resultados encontrados e muitas vezes essa tarefa pode parecer desgastante quando os relatórios são muitos extensos e repetitivos.</p>

Hackeando o R: estratégia split-apply-combine

Veja como aplicar essa estratégia de maneira eficiente utilizando os pacotes do tidyverse: dplyr+tidyr+purrr

Fellipe Gomes

6 minute read

Diagrama da estratégia split-apply-combine com dplyr, tidyr e purrr no R <p>Geralmente em uma análise de dados precisamos compreender, além do comportamento geral dos dados, o seu comportamento de acordo com alguns segmentos.</p>

Análise de sobrevivência com dados do jogo PUBG disponíveis no Kaggle

O que interefere na probabilidade de um indivíduo sobreviver? Quais fatores apresentam efeito no risco de morte em um intervalo de tempo? Neste post buscaremos evidências estatísticas para responder estas perguntas em dados abertos do PUBG hospedados no Kaggle

Fellipe Gomes

19 minute read

Curvas de sobrevivência de Kaplan-Meier aplicadas a dados do jogo PUBG do Kaggle <p>Análise de sobrevivência é um termo que se refere a situações médicas e é caracterizada pela sua variável resposta, que pode ser apresentada de três formas: probabilidade de sobrevivência, taxa de incidêcia e taxa de incidência acumulada.</p>

Seu app, RStudio e Shiny Server na nuvem do Google

Uma maneira prática de hospedar o app desenvolvido no post no Shiny Server e ter seu próprio RStudio Server na nuvem do Google em uma máquina virtual Ubuntu 16.04.

Fellipe Gomes

12 minute read

Arquitetura de deploy de Shiny Server e RStudio Server na Google Cloud Platform <p>Uma das várias maneiras de se implementar o <a href="https://www.rstudio.com/products/rstudio/download-server/">RStudio Server</a> e o <a href="https://www.rstudio.com/products/shiny/download-server/">Shiny Server</a> é através de serviços de nuvem que fornecem máquinas virtuais. Empresas gigantes no mercado como Amazon Web Services (AWS), Microsoft, Google, IBM, Oracle etc têm investido pesado nestes serviços e a escolha de qual cloud utilizar deve ser feita de acordo com a necessidade do…
Politica de Privacidade | Termos de Uso