Sobre mim

Meu nome é Giovano Panatta

Cientista de Dados em formação pela Faculdade de Tecnologia do Instituto Infnet, com conclusão prevista para 2024. Apaixonado por gerar insights a partir da exploração de dados, busco oportunidades para atuar profissionalmente e contribuir para o sucesso de projetos em Ciência de Dados e Machine Learning.

Habilidades

Linguagens de Programação e Banco de Dados

  • Python com foco em análise de dados.
  • Web scraping com Python.
  • SQL para extração e manipulação de dados.
  • Banco de Dados SQLite, PostgreSQL, MySQL, Oracle e MongoDB.

Estatística e Machine Learning

  • Estatísticas gerais.
  • Métricas de Negócio.
  • Algoritmos de Regressão, classificação e clusterização.
  • Técnicas de balanceamento dos dados, seleção de atributos e redução de dimensionalidade.
  • Métricas de performance dos algoritmos (Confusion Matrix, Acurácia, RMSE, MAE, Precisão, Recall, Curva ROC, AUC, F1 score, DB-Index).
  • Pacotes de Machine Learning: Sklearn e Statsmodels.

Visualização de Dados

  • Matplotlib, Seaborn, Plotly.
  • Streamlit.
  • Engenharia de Software

  • SQLite3 Database.
  • Github.
  • Python API's.
  • .

    Idiomas

    • Português - Nativo
    • Inglês - Avançado
    • Espanhol - Avançado
    • Francês - Avançado
    • Italiano - Intermediário

    Experiência Profissional

    Chefe de Cabine em Aeronaves

    Minha jornada profissional evoluiu da aviação para a Ciência de Dados, um percurso que me permitiu aliar as habilidades interpessoais desenvolvidas durante esse período à minha paixão por tecnologia e análise. Nesse ambiente, aprimorei minha capacidade de solucionar problemas de forma eficiente e de comunicar-me de forma clara e empática, mesmo em contextos multiculturais e desafiadores. Essa transição para a Ciência de Dados foi motivada pelo meu interesse em enfrentar novos desafios, permitindo-me aplicar minha capacidade analítica através de uma sólida compreensão de dados e uma abordagem comunicativa efetiva, tanto com equipes quanto em projetos nos quais me envolvo.

    Projetos em Ciência de Dados

    Dashboard de Vendas Globais

    Dashboard de Vendas Globais

    Este projeto realiza a análise, limpeza e transformação de um conjunto de dados de vendas online, culminando na criação de um banco de dados PostgreSQL e dashboards interativos com Power BI e Streamlit. Utilizamos algoritmos de Regressão Linear para prever vendas, segmentação de clientes com K-means, e vetorização de palavras com TF-IDF para criar segmentos de produtos.

    Tecnologias Utilizadas:

    • Python para manipulação e análise de dados
    • pandas para manipulação de DataFrames
    • re para operações com expressões regulares
    • TfidfVectorizer para vetorização de descrições de produtos
    • KMeans para algoritmos de clusterização e segmentação de clientes
    • Regressão Linear para previsão de vendas
    • sqlalchemy para conexão com banco de dados SQL
    • matplotlib e seaborn para visualizações de dados
    • PostgreSQL para armazenamento dos dados
    • Power BI e Streamlit para criação de dashboards interativos
    Previsão de Casos de Dengue

    Modelo Preditivo de Casos de Dengue

    Este projeto desenvolve um modelo preditivo para estimar o número de casos de dengue nos próximos 1500 dias, utilizando análise de séries temporais para entender os padrões de transmissão da doença influenciados por fatores climáticos e urbanização. A precisão nas previsões pode ajudar as autoridades de saúde a planejar melhor e agir de forma mais efetiva.

    Tecnologias Utilizadas:

    • Python para construção do modelo e manipulação de dados
    • SQLalchemy para extração de dados
    • Notpuna para fine tuning do modelo
    • LGBMRegressor para modelagem preditiva
    • Feature Engineering, Estatística e Análise Exploratória de Dados para otimização e insights
    Chatbot Jurídico sobre LGPD

    Chatbot Jurídico: LGPD para Cientistas de Dados

    Este chatbot foi desenvolvido para auxiliar cientistas de dados a entenderem melhor a Lei Geral de Proteção de Dados (LGPD) e como ela se aplica aos seus projetos. O chatbot utiliza dois modelos avançados de inteligência artificial: Embbeding e Generativo.

    Tecnologias Utilizadas:

    • Python para construção e execução do modelo, e manipulação de dados
    • Modelo de Embedding treinado com o uso de um arquivo JSON contendo legislação sobre LGPD para captura de semântica
    • Modelo Generativo Gemini Pro para a geração de respostas baseadas nas consultas e contexto jurídico
    Visualização de Dados

    Análise Exploratória e Visualização de Dados

    Este projeto explora técnicas avançadas de análise exploratória e visualização de dados, proporcionando insights valiosos a partir de conjuntos de dados complexos.

    Tecnologias Utilizadas:

    • Python, Pandas, Matplotlib, Seaborn
    • Exploração e interpretação de grandes volumes de dados
    • Criação de visualizações de dados interativas e informativas
    Dados do Mercado Imobiliário

    Análise Exploratória de Dados do Mercado Imobiliário

    Uma análise exploratória de dados do mercado imobiliário, focando em características significativas dos lotes como frente e área, além de variáveis categóricas importantes.

    Tecnologias Utilizadas:

    • Python para análise de dados
    • Pandas para manipulação e análise de dados
    • Matplotlib e Seaborn para visualizações de dados
    • Jupyter Notebook para visualização de código e execução
    Visualização de Dados com Streamlit

    Visualização de Dados com Streamlit

    Apresentação de aplicativos interativos criados com Streamlit para visualização dinâmica e interativa de dados.

    Tecnologias Utilizadas:

    • Criação de aplicações web com Streamlit
    • Visualizações de dados interativas
    • Interação dinâmica com análises
    • Uso de Python e gerenciamento de pacotes com pip
    Raspagem de Dados com Python

    Raspagem de Dados com Python

    Este projeto ilustra o uso de técnicas de web scraping em Python para extrair informações de websites e tabelas online.

    Tecnologias Utilizadas:

    • requests: Envio de solicitações HTTP.
    • BeautifulSoup: Análise e extração de conteúdo HTML.
    • Python: Linguagem de programação para scripts de raspagem.
    Análise de Dados de Cervejarias

    Análise de Dados de Cervejarias com a API Open Brewery DB

    Este projeto demonstra a coleta e análise de dados sobre cervejarias utilizando a API Open Brewery DB, com foco nas cervejarias de Nova York.

    Tecnologias Utilizadas:

    • requests: Para requisições HTTP à API.
    • json: Para manipulação de dados JSON.
    • pandas: Para análise e manipulação de dados.
    Análise de Sentimentos do Twitter e Feature Engineering com o Dataset Titanic

    Análise de Sentimentos do Twitter e Feature Engineering com o Dataset Titanic

    Dividido em duas partes, este projeto aborda a análise de sentimentos do Twitter e técnicas de feature engineering no dataset do Titanic.

    Tecnologias Utilizadas:

    • Tweepy para coleta de tweets.
    • NLTK para pré-processamento de texto.
    • Scikit-learn para vetorização de texto e modelagem.
    • Pandas para manipulação dos dados.
    Validação de Dados com Pandera

    Validação de Dados com Pandera

    Este projeto se concentra na validação de dados usando Pandera, para garantir a integridade e correção de diferentes conjuntos de dados, incluindo um exemplo prático com dados do Titanic e uma base de dados fictícia gerada com Faker.

    Tecnologias Utilizadas:

    • Pandas para manipulação e análise de dados.
    • Pandera para validação de esquemas de DataFrames.
    • Faker para geração de dados fictícios.
    Análise de Sentimentos no Twitter

    Análise de Sentimentos no Twitter

    Projeto de análise de sentimentos no Twitter utilizando PLN e aprendizado de máquina para classificar tweets em categorias emocionais específicas.

    Tecnologias Utilizadas:

    • Python 3 para análise e processamento de dados.
    • Pandas para manipulação de conjuntos de dados.
    • Scikit-learn para modelagem de aprendizado de máquina.
    • NLTK para processamento de linguagem natural.
    • Matplotlib para visualização de dados.
    • Jupyter Notebook para desenvolvimento e documentação.
    Análise de Dados de Crédito

    Análise de Dados de Crédito

    Este projeto aborda uma análise exploratória dos dados de crédito, utilizando Python e Pandas para investigar padrões e insights valiosos.

    Tecnologias Utilizadas:

    • Python para análise de dados e execução de scripts.
    • Pandas para manipulação e análise de DataFrames.
    • Matplotlib e Seaborn para visualizações gráficas dos dados.
    • Jupyter Notebook para documentação e apresentação de análises.
    Visualizações de Consumo de Energia Elétrica e Outros Dados

    Visualizações de Consumo de Energia Elétrica e Outros Dados

    Exploração de visualizações dos dados de consumo de energia elétrica, campeonatos esportivos e pesquisas de satisfação de clientes usando Pandas, Seaborn, Matplotlib e Streamlit.

    Tecnologias Utilizadas:

    • Python para programação e análise de dados.
    • Pandas para manipulação de dados.
    • Matplotlib e Seaborn para visualizações estatísticas.
    • Streamlit para criação de aplicações web interativas.

    Entre em Contato

    Sinta-se à vontade para entrar em contato comigo por e-mail ou pelo LinkedIn: